AI 革命を理解する

ポストする 投稿者:  — 1 コメント ↓

パー・バイランド著

人工知能 (AI) 革命が到来し、私たちが知っている世界は必ず変わります。—あるいは、2022 年 11 月に OpenAI の ChatGPT バージョン 3.5 がリリースされた後の誇大宣伝を宣言していますが、これはほんの始まりにすぎません。実際、それ以来、Microsoft の Bing 検索エンジンに統合された大幅に改良されたバージョン 4.0 のリリースや、Google の Gemini の最近のベータ リリースなど、多くのことが起こりました。

それ以来、まもなく登場するスタートレック技術と「限界費用ゼロ」社会のポジティブな極端から、大量失業や奴隷化を引き起こす差し迫ったとされる「AI乗っ取り」に至るまで、AIが人類と社会にとって何を意味するかについて多くの本が書かれてきた。 (絶滅ではないにしても)人類の。しかし、これはどこまでがフィクションで、どこまでが本当なのでしょうか?この 3 部構成の記事シリーズでは、AI の現実と虚構、AI が経済学 (および経済) にとって何を意味するのか、そして本当の危険と脅威とは何かについて簡単に説明します。これは終わりの始まりなのか、それとも始まりの終わりなのか?

ほとんどの人は、「人工知能」という用語を SF の本や映画で見たことがあります。この種のメディアにおける AI は、非生物学的な意識を持つ存在、つまり一種の機械人間です。知的な機械は、共感や倫理などの人間の特質を欠いているものとして描かれることがよくあります。ただし、不完全な計算能力や知識の欠如などの人間の制限にも影響されません。『スタートレック: 次世代』 の アンドロイドのデータのように、AI は良性であり、人類の友人、または使用人でさえある場合もあります が、AI は問題、緊張、さらには実存の脅威を明らかにするために使用されることがよくあります。このようなディストピア AI の例には、 映画『ターミネーター』 の スカイネット 、  『マトリックス』 の マシン、および 『2001 年宇宙の旅』の HAL  9000が含まれます。

OpenAI のChatGPT や Google の Geminiなど、現在現実世界で誇大宣伝されている「AI」は 、これらの SF の「生き物」とはまったく異なります。彼らは意識のある存在には程遠いのです。実際、私たちが今日持っているものは、一般的に知性と呼ばれるものとはかけ離れているため、現在「AI」と呼ばれている既存のチャットボットと「本物」を区別するために、 汎用人工知能という新しい用語が発明されました。SF に登場する、意識を持ち、思考し、推論し、行動する非生物的な生物機械は、汎用人工知能です。ここで、「AI とは何ですか?」という疑問が生じます。

機械学習と大規模言語モデル

現在の AI は、本の図書館と同じ意味での知性です。どちらも、トピック、キーワード、著者、発行者など、さまざまな方法で分類された大量の情報を保持しています。通常の図書館の場合、ユーザーが探しているものを見つけやすいように書籍が分類されています。

しかし、図書館にあるすべての本がスキャンされて、すべての文字、単語、文章などが一緒に保存され、簡単に検索できるようになったと想像してください。この大量のコンテンツは帰納的に分類できる可能性があります。これは、すべてのコンテンツを選別するコンピュータ ソフトウェアがデータ自体に基づいて独自の新しいカテゴリを見つけ出すことができることを意味します。一般的な単語やフレーズとは何ですか? 単語はどのように組み合わされ、どのような順序で、どのような文脈でそれらの順序が存在するのでしょうか? どのような種類の本や章でどのようなフレーズがより頻繁に使用されますか? 珍しい、または存在しない単語の組み合わせは何ですか? 著者、本、トピックによって、単語の使用や文章の構造に違いはありますか?

統計アルゴリズムに基づいてコンテンツを誘導的に選別することは「機械学習」と呼ばれ、情報の干し草の山から貴重な針を見つけるための強力なツールです。これらの針はまだ知られていない可能性があることに注意してください。機械学習は存在を知っている針を見つけますが、存在することを知らなかった針を発見することもできます。たとえば、このような技術を使用して医療データを調査すると、これまで知られていなかった病気の相関関係や潜在的な原因を見つけることができます (そして実際に見つかっています)。同様に、 ジョージ メイソン大学のメルカタス センターは、 このような機械学習アルゴリズムを通じて規制テキストを入力し 、ユーザーが米国内外の規制負担を分析、比較、追跡できるデータベースであるRegDataを作成しました。

RegData は規制に関する社会科学研究をサポートすることを目的としていますが、機械学習はあらゆる種類の情報に使用できます。言語がどのように使用されているかを解明するために、このようなアルゴリズムが膨大な量のテキストに対して実行される場合 、それは大規模言語モデル (LLM)と呼ばれます 。したがって、これらのモデルは、言語がどのように使用されているかについての統計的な「理解」、または ケンブリッジ辞典で 言うところの (ChatGPT のベースとなる生成事前学習トランスフォーマー (GPT) LLM を説明する)、「テキストまたはその他の型の複雑な数学的表現」を捕捉します。人間の脳の働きに似た方法で、コンピューターが言語の解釈と生成、画像の認識または作成、問題解決などのタスクを実行できるようにするメディアのこと。」

実際、LLM チャットボットは、言語の統計的理解に基づいて、実際の会話を模倣した方法で、質問や発言に対するテキスト応答を予測的に生成できます。これにより、質問を理解し、適切な応答を作成したように見えます。言葉の使い方をどのように理解しているかに基づいて、感情を持っている「ふり」をして共感や感謝の気持ちを表現することもできます。

言い換えれば、ChatGPT のような LLM チャットボットは、  人間がその応答を実際の人間の応答と区別することが非常に困難であるため、おそらくチューリング テストに合格する可能性があります。それでも、これらは統計的な予測エンジンです。

しかし、AIはインテリジェントなのでしょうか?

確かに、ソフトウェアに人間の会話を模倣させ、実際の人間を騙して人間であると信じ込ませるというのは、素晴らしい偉業です。ただし、それが知的かどうかという疑問は残ります。もう一度ケンブリッジ辞典を参照すると 、 知性と は「学び、理解し、理性に基づいて判断したり意見を持つ能力」を意味します。私たちは機械に対して「学ぶ」や「理解する」などの動詞を使用することがありますが、これらは文字通りの用法ではなく比喩的に使用されます。ポケット電卓は、数学的な質問に対する答えを提示したり、方程式を解くことができるという理由だけで、数学を「理解」しているわけではありません。それを「学習」していない。また、「判断する」ことも「意見を持つ」こともできません。

確かに、AI は電卓よりもはるかに進歩しています。ただし、これは、それらが論理的に同じであるという事実を取り除くものではありません。両方とも、事前に構造化され、事前に収集されたルールとデータに基づいて結果を表示します。どちらも主体性も意識も持たず、新たに何かを生み出すこともできません。これは計算機にとって明らかであり、計算機は比較的愚かで、単純な数学規則に従ってのみ出力を生成します。

ただし、AIについても同様です。もちろん、電卓よりもはるかに複雑で、独自のカテゴリを作成し、帰納的に関係を見つける機能も追加されていますが、「[独自の]理由に基づいた意見を持っている」わけではありません。すでに処理したテキストに基づいて、人間が生成する可能性が統計的に高い (または少なくとも生成できる) 応答のみを予測的に生成します。これが、AI が膨大な知識にアクセスできるにもかかわらず、時々、とんでもないことを 吐き出し 、真実を貫くのに苦労する理由です。単純に違いを見分けることはできません。(それはまったく「伝える」ことができません。)

言い換えれば、AI は論理的には、人間 (または宇宙人や人工) の知能に期待されるものとはまったく逆のことを言っています。つまり、AI は後ろ向きであり、既存の言語データに基づいて応答を作成し、必要なものを何も追加しません。過去の情報から統計的に(再現)再現できない。また、失敗したり、失敗したり、忘れたりすることもなく、主体性が欠けています。

もちろん、実際のインテリジェンスは経験にも依存しますが、新しい内容と含意を生成する能力を備えているでしょう。同じデータに基づいて、新たに考え、創造的に異なる結論を導き出すことができるでしょう。実際の知性は、貴重な情報を忘れたり、間違いを犯したり、誤った推論を使用したり、主観的に事実を比較検討したり解釈したりします。あるいは、選択することもできます。データを無視すること。

ただし、AI はおそらく、少なくとも SF の意味では知性ではありませんが、それが重要ではない、または意味が欠けているという意味ではありません。それが表す技術の進歩はまさに革命的であり、経済と社会の両方に広範な影響を与えるでしょう。