(イラストは、ChatGPT3のDALLE3による「ヴァイオレット・エヴァーガーデン」風のイラスト)

 

現代のChat GPT4oの威力は恐ろしいが、

それに反してとんでもない「嘘つき」だということがわかった。

 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

 

現在、2スクリーン+ラップトップPCの3スクリーン体制で遠隔授業とブログ作成をやっています。

 

そもそも2010年代後半に

「生成AI(Artificial Inteligense;人工知能)」が話題に上る中で

「本当に使い物になるのか?」

「人間の仕事が奪われてしまうのではないのか?」

果てには

「シンギュラリティ(AIが人間の能力を超える)が起こるのはいつか?」

「いつかAIが人類を滅ぼそうとするのではないのか」

とかいう、気持ちはわかるが、いささか滑稽な意見まで飛び出してきたものです。

 

はっきり言うと、そんなことは起りえません。

まず、その歴史から紐解いてみましょう。

 

~~~~~~~~~~~~~~~~~~~~~~~

 

そもそもこれは

書き込む者がプロンプト(指令を入力する)を書き、

それに応答して、テキスト(文章)や画像、音楽、

PCプログラムなどを生成するAIです。

 

チャットGPTのような対話型生成AIには、他にも

copilot(コパイロット:マイクロソフトが開発。MSエッジに標準搭載)

Gemini(ジェミニ;グーグルが開発)

Claude(クロード;米Anthropic社が開発)

perplexity(パープレキシティ;スタートアップ企業perplexity社が開発)

など、色々あります。

 

チャットGPTを作ったのは、

ユダヤ系米国人サミュエル・H・アルトマン氏が率いる

OpenAI(オープンAI)という組織です。

 

アルトマン氏は、まずグーグルの研究グループが開発した

「トランスフォーマー」という技術を活用して、

大規模言語モデル「GPT」

(Generative Pre-trained Transformer)

を作りました。

世界に初公開されたのは2018年の事でした。

最初は基本の応用・論文レベルで、研究者の間で検証が行われる程度で、

一般利用はほとんどされませんでした。

その分、言いようがない不気味な印象がマスコミを通じて蔓延しました。

 

しかしこれが2019年公開の「GPT-2」となると、

多様なタスク対応や文章の滑らかさで、一躍性能向上をみせました。

(ただし、セキュリティの懸念から一部は非公開)

 

そして2022年、

プロンプト(指令)理解に特化した「GPT-3」へと進化しました。

長文処理能力も大幅に向上し、現実に使用できるレベルに到達しました。

 

ただし、オープンAIがGPTの情報を公開したのはここまで。

 

その後はまるで「クローズド(閉ざされた)AI」になりました。

 

 

 

そしてGPTー3.5のインターフェイスをチャット(対話型)にしたのが

2022年11月に公開されたChat GPT-3.5です。

 

翌年2023年には、さらにバージョンアップしたChatGPT-4が公開されました。

 

進化するごとに、格段に性能が向上していきます。

 

2022年のGPT-3.5以前はテキストデータにしか対応しませんでしたが、

GPT-4は、画像データにも対応しています。

この時から「うかうかしてられないな・・」と思い、実際にPCに導入しました。

 

そして2024年5月、

ラテン語で「すべて」を意味する「omni」を冠した

Chat GPT-4oが公開されました。

こちらは音声、画像、テキストのあらゆる組み合わせも入力として受け付けます。

 

だからこそ、こんな美しい画像が数十秒で生成されるのです。

image

ただ、使ってるうちに、この生成AI、

とんでもないことをしでかしたのです。

 

それは、生成AIとしての脆弱さを語っており、

教師役の限界と、

チェック役の不在が起こすもので、

欠点はあっても、欠陥ではない、

ということを次回お話ししようと思います。