ChatGPTとタイパとKnowとUnderstand | 熱脳しゃちょのブログ

熱脳しゃちょのブログ

おせっかい焼SE兼プログラマ兼……の辛い日々と、思う事なぞ

ChatGPTで、タイパ最高!

 

ってのに違和感を覚えるのは、言語化できるか否かの差があるとは言え、KnowとUnderstandの違いが何となく理解できるからだろうと思う。

他方、両手をあげて賛成する人は、Understandなんて当然でしょというハイパフォーマか、KnowとUnderstandの違いが理解できない自称意識高い系の人のどっちかでしょう。

で、このハイパフォーマーは、KnowとUnderstandの違いが理解できない存在というのを理解できていないんじゃないか、と思う。

この一段メタな状態を含めて、KnowとUnderstandの違いが理解できない人、がこれをもてはやしていると考えている。

 

このChatGPT、結局第五世代コンピュータで夢見られていた「何でも知っているエキスパートシステム」で、出力にお化粧をしているだけです(いや違う。人間を超える知能、知性だ、人格すら持っていると主張する人がいるなら、そこらへん、細かく説明していただきたいです)。

第五世代の頃は、知識ベースを人の手でちまちまと構築していました。

例えば、波平{男,54} -子-> カツオ{男,11}、波平{男,54} -子-> ワカメ{女,9} という辞書データを手で作って、カツオとワカメの関係は? と聞くと、共通の親(子の逆)がいて、年上の男と年下の女なので、「兄妹」と答える、みたいな。

これを、Web上のデータを掻っ攫ってガラガラポンして巨大な辞書を作りました。ってのがChatGPTとかの大体の説明になる(もちろん、正確にはもっと難しい色々が付きまとってくるが)。

ちなみに、これと似た現象は、インターネット黎明期の検索システムにもあって、当時人力でWebサイト(ページ)の辞書を作って公開する会社がいて、これに対して全てのページにボットでクローリングして処理にかけて自動で辞書を作るということをして質より物量で圧倒した会社が覇権を握った。

その会社の名前はGoogle。

それが繰り返されているだけ。

 

で、まぁ、この自動で作った辞書なのだが、問題はいくつもある。

そのうちの一つが、元データが「Webページにわざわざ書かれた知識」という時点で既に偏っている、という点。

わざわざ書くまでもないことは、書かれないんですよ。

自然科学分野は、あまり問題ないんだが(細かくいうと、それでも怪しい分野はあると考えている)、社会科学系とか文化人類系。

特に性別とか人種とか扱ってるところは、基本的に無茶苦茶偏ります。

なぜなら、数十年前はまだ人種差別が厳然として存在していて("I have a dream"が60年前!)、その何百年も前から書物(文章、研究論文)は存在しているわけだからね。

んで持って、共通部分に言及するより、違う部分に言及する文章が多くなるなんて当然の話だからその差が強調されるだろうし、人種差別の歴史を研究した論文だって処理対象に含まれるだろう。

「それ知ってる〜」の内容は、その人種などによる差異を殊更強調されて出てくるのは、想像に難くない。

そして、人種差別を否定するためのポリコレ的論文だって最近は増産されている。

さらに取り出す情報が確率で変わるので、この辺りは阿鼻叫喚的な事態に陥っているだろう

 

これはこれで、人類が過去数百年、興味を持ってきた歴史、みたいなもんなのに、なぜか利用する側は「神が書いた世界の正しい姿」とか思い込んでる。
提供する側も、金を確保するために、チャンピオンデータでみんなを騙しにかかっている(例えば司法試験の例とか)。
で、これを真に受けてポリコレ界隈が腕まくりして誰かを殴りに行こうとアップしてる。

曰く「AIは偏見を持つ」「偏見を持つAIは廃棄せよ」。

いや、AIが偏見を持っているんじゃなく、過去の文字情報を何も考えずガラガラポンしているだけです。

その意味で言えば、むしろ偏見を持っているのはあなたです。

 

これ、基本的に壊れた高田純二の戯言ですよ。
たまに出てくる、壊れた高田純二の「いいこと言う」ってのをもてはやしすぎなんですよ(本物の高田純二さんは芸としてあれをやってるからすごいんであって、普段からあれだったらただのポンコツですよ)。
 
ところで、個人的にAI研究者に感じるのが、ほとんど中世の錬金術師だな、ということ。
錬金術師は現代の科学に通じる成果を出した。って、いや、大部分はただの「金が作れますよ」って吹いて回る系だったじゃないですか。
当時と今の違いは、当時は金主が気づいたら死刑だったけど、現代はいつまでも「その分野の権威」でい続けられると言うところ。
まぁ、ひでぇ話だな、と30年以上前からずーっと思っていることではある(どーでもいい話だが)。
 
とは言え、とは言えではある。
「コアコンピタンスが〜」とかいう営業連中、「オブジェクト指向がー」「関数型プログラミングは最新のー」「ドメイン駆動がー」「テスト駆動がー」とかいうエンジニア連中の大半と変わらない、と言えば変わらないかもしれないと言う点で、置き換えられちゃうかもなーという気がしないではない。

そう言う難しい言葉知ってる〜、つって中途半端なKnowを披露しているだけって、基本的にChatGPTがやってることと同じだから。

ちょっと怪しい内容でも、その場の雰囲気で適当にでっち上げるのも、まぁ、似てる。

 

このChatGPTのKnowの正確さをどう担保するかとなると、これはかなり難しいとしか言いようがない。

元データがWeb上の文字データしかないから。

かろうじてサイトの信用格付けみたいなのをするくらいか、と言ってもその信用データ自身、どうやって正確さを担保するの? っていうメタな問題が解決できない。

その程度の存在ですよ、と。

 

ChatGPTなんぞ使ってKnowを五万と並べても、クソの役にも立たんのです。

> 何もかも丸暗記はしているのに、その内容はさっぱり理解していないのだということに思い当たった。(岩波現代文庫「ご冗談でしょう、ファインマンさん(下) 」p.43)

つまり、そういうこと。

KnowをUnderstandの状態にレベルアップするのに必要なのは、「身体化」と言っていいんかな?

「わかった!」となればいいんだ。

その「わかった!」になるためには時間がかかる。

でもって、そこにチャレンジするためには、大量の「体系だったKnow」が必要で、それを確保するためには一旦「大量のKnowを詰め込む」必要がある。

ってのが学校の存在だ。

そして、「わかった!」になるためには時間がかかる、というのが「タイパ」と根本的に矛盾する。

ChatGPTを使ってChatGPT以下の存在に成り下がるって、どう考えてもただのバカです。

 

人間はChatGPTに負ける?

いやいやどうして。

人間って存在は、そんなに馬鹿にしたもんではない。

ChatGPTはUnderstandにレベルには、どう考えても到達できない。

だから人はUnderstandにレベルに到達するだけでいいんですよ。

ということは、Understandの状態にレベルアップするための場所なら、ChatGPTなんぞ利用禁止にした方がいい。

ChatGPTの利用法なんて、職業訓練なんかで必要になった時に、さらっとやればいい。

Understandのレベルにいれば、Knowの正誤なんて迷うことはない。

ChatGPTとタイパとKnowのトライアングルに惑わされることなく、ちゃんと勉強すれば済むだけの話ですよ。