現代のChat GPT4oの威力は恐ろしいが、
それに反してとんでもない「嘘つき」だということがわかった。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
現在、2スクリーン+ラップトップPCの3スクリーン体制で遠隔授業とブログ作成をやっています。
そもそも2010年代後半に
「生成AI(Artificial Inteligense;人工知能)」が話題に上る中で
「本当に使い物になるのか?」
「人間の仕事が奪われてしまうのではないのか?」
果てには
「シンギュラリティ(AIが人間の能力を超える)が起こるのはいつか?」
「いつかAIが人類を滅ぼそうとするのではないのか」
とかいう、気持ちはわかるが、いささか滑稽な意見まで飛び出してきたものです。
はっきり言うと、そんなことは起りえません。
まず、その歴史から紐解いてみましょう。
~~~~~~~~~~~~~~~~~~~~~~~
そもそもこれは
書き込む者がプロンプト(指令を入力する)を書き、
それに応答して、テキスト(文章)や画像、音楽、
PCプログラムなどを生成するAIです。
チャットGPTのような対話型生成AIには、他にも
copilot(コパイロット:マイクロソフトが開発。MSエッジに標準搭載)
Gemini(ジェミニ;グーグルが開発)
Claude(クロード;米Anthropic社が開発)
perplexity(パープレキシティ;スタートアップ企業perplexity社が開発)
など、色々あります。
チャットGPTを作ったのは、
ユダヤ系米国人サミュエル・H・アルトマン氏が率いる
OpenAI(オープンAI)という組織です。
アルトマン氏は、まずグーグルの研究グループが開発した
「トランスフォーマー」という技術を活用して、
大規模言語モデル「GPT」
(Generative Pre-trained Transformer)
を作りました。
世界に初公開されたのは2018年の事でした。
最初は基本の応用・論文レベルで、研究者の間で検証が行われる程度で、
一般利用はほとんどされませんでした。
その分、言いようがない不気味な印象がマスコミを通じて蔓延しました。
しかしこれが2019年公開の「GPT-2」となると、
多様なタスク対応や文章の滑らかさで、一躍性能向上をみせました。
(ただし、セキュリティの懸念から一部は非公開)
そして2022年、
プロンプト(指令)理解に特化した「GPT-3」へと進化しました。
長文処理能力も大幅に向上し、現実に使用できるレベルに到達しました。
ただし、オープンAIがGPTの情報を公開したのはここまで。
その後はまるで「クローズド(閉ざされた)AI」になりました。
そしてGPTー3.5のインターフェイスをチャット(対話型)にしたのが
2022年11月に公開されたChat GPT-3.5です。
翌年2023年には、さらにバージョンアップしたChatGPT-4が公開されました。
進化するごとに、格段に性能が向上していきます。
2022年のGPT-3.5以前はテキストデータにしか対応しませんでしたが、
GPT-4は、画像データにも対応しています。
この時から「うかうかしてられないな・・」と思い、実際にPCに導入しました。
そして2024年5月、
ラテン語で「すべて」を意味する「omni」を冠した
Chat GPT-4oが公開されました。
こちらは音声、画像、テキストのあらゆる組み合わせも入力として受け付けます。
だからこそ、こんな美しい画像が数十秒で生成されるのです。
ただ、使ってるうちに、この生成AI、
とんでもないことをしでかしたのです。
それは、生成AIとしての脆弱さを語っており、
教師役の限界と、
チェック役の不在が起こすもので、
欠点はあっても、欠陥ではない、
ということを次回お話ししようと思います。

