「Cycプロジェクト」って何？常識をAIに教え込む壮大な挑戦！

AIに関する本やニュースを見ていると、「Cyc(サイク)プロジェクト」という言葉に出会うことがありますよね。

「サイクって何？」「難しそう…」と感じる方もいるかもしれません。でも、ご安心ください！今回は、このちょっと謎めいたAIプロジェクト「Cyc」について、AI初心者さんにもバッチリわかるように、楽しく解説していきます！

Cycは、ただの最新技術の話ではありません。AIが本当に「賢い」ってどういうことなんだろう？そして、私たち人間が当たり前のように持っている「常識」を、どうやったら機械に教えられるんだろう？そんなAI研究の深い問いに、真正面から挑んだ、まさに「壮大な挑戦」なんです。

Cycプロジェクトって、そもそも何？

Cyc（サイクと読みます）は、1984年にダグラス・レナトというすごいAI研究者が始めた、とっても長い歴史を持つAIプロジェクトです。その目的は、簡単に言うと「この世界がどう動いているか」に関する基本的なルールや知識を、AIにぜ〜んぶ教えて、巨大な知識のデータベースを作っちゃおう！というもの。特に、私たち人間が普段意識せずに使っている「常識」をAIに理解させようと、今も頑張っているんです。

「Cyc」という名前は「encyclopedia（百科事典）」から来ています。まさに、人間が持つ常識をすべて網羅した「知の百科事典」をコンピュータの中に作ろうとしているイメージですね。

このプロジェクトは、当時、日本のAI研究「第五世代コンピュータプロジェクト」に対抗するために、アメリカの企業連合が国の支援を受けてスタートしました。その後、1995年からはレナト氏が作ったCycorp社が開発を引き継いでいます。Cycは「シンボリックAI」という、ちょっと専門的な分野で最大規模の実験として知られていて、その野心的な目標と長い歴史から、「AIの歴史で最も議論を呼んだ取り組みの一つ」とも言われています。

💡 今もCycプロジェクトは続いているの？

はい、Cycプロジェクトは現在もバリバリ続いています ！

創設者のダグラス・レナト氏は2023年8月に亡くなりましたが、プロジェクト自体は商業契約を通じて資金提供を受け、約50人もの技術スタッフが今も開発を続けています。Cycorp社は「機械推論AI」のプロフェッショナルとして、その知識ベースと推論エンジンを基盤とした製品やサービスを提供。病院の業務効率化やサプライチェーン管理など、特定の分野で活躍しているんですよ。

現在のCycは、人間が手作業で知識を入力する「知識エンジニアリング」という地道な作業と、その知識を使って効率的に推論する方法の開発に力を入れています。さらに、最近流行りの機械学習や自然言語理解の技術も取り入れ、ユーザーがもっと自然な言葉でCycと会話したり、Cyc自身が知識を増やしたりする手助けもしているんです ²。Cycの知識ベースは、現在「Wikidata」という巨大な知識の宝庫と連携していて、将来的には他のデータベースともつながる計画があるそうです ²。

なぜ「常識」がAIに必要だったの？

1970年代から80年代初めにかけて、「エキスパートシステム」というAIが注目されていました。これは、特定の専門分野（例えば、病気の診断や化学分析）では、人間顔負けの知識を発揮できるAIです。でも、大きな弱点がありました。それは、専門分野から一歩でも外れると、途端に何もできなくなる「脆さ」（もろさ）という問題です。

例えば、病気の診断ができるエキスパートシステムは、病気の知識は豊富でも、「患者さんが病院に来る」といった、私たちにとっては当たり前の常識が欠けているため、予期せぬ状況に対応できなかったんです。

この「脆さ」の原因は、人間が当たり前のように持っている「常識」がAIにないことだと考えられました。私たちが普段、自然に物事を判断したり、会話を理解したりするには、明示的に教えられなくても共有されている、とてつもない量の「常識」が必要ですよね。

Cycプロジェクトは、この「常識の欠如」というAIの根本的な限界に挑むために始まりました。レナト氏は、本当に汎用的なAI（なんでもできるAI）を作るには、この膨大な常識知識の土台が不可欠だと強く信じていたんです ¹³。

Cycの心臓部：常識知識をAIに教え込む方法

Cycプロジェクトの核は、人間が持つ常識知識を、機械が理解できる形に整理して入力し、それを使ってAIが自分で考えて答えを導き出す能力を与えることでした。

「常識」ってどうやって教えるの？

Cycが考える「常識」とは、新聞記事や百科事典を読むときに、人間が当たり前のように知っていると想定される背景知識、つまり「人間が共通して認識している現実」のことです。

Cycのアプローチは、この常識知識を、人間が手作業で一つ一つ大きなデータベースに入力していく「手作業によるエンコード」という方法でした。これは、知識を「論理的な記述」（まるで数学の式のように）の形で表現し、それらを組み合わせて結論を導き出すという、とても古典的なやり方です。

例えば、Cycは「ガルシアがマラソンを完走している」という情報から、「ガルシアは濡れている」と推論できます。これは、「マラソンは激しい運動を伴う」「人は激しい運動で汗をかく」「汗をかく人は濡れている」という常識ルールを知識ベースに持っているからこそ可能になるんです。まるで、幼い子供に言葉や物事を一つ一つ教えていくような、地道で根気のいる作業ですね。

知識のデータベース（KB）の仕組み：CycL言語とマイクロセオリー

Cycの知識ベース（KB）には、約2500万もの「アサーション」（事実や断言）が登録されていて、推論エンジンと組み合わせると、数兆もの知識を生み出せると言われています ¹⁶。この知識は「CycL」というCyc独自の言語で書かれています。CycLは、論理学の「一階述語論理」を拡張したもので、その表現力は非常に高く、英語で表現できることは何でもCycLで表現できるとされています。

KBはさらに、「マイクロセオリー」と呼ばれる約100の小さな知識の塊に分けられています。それぞれのマイクロセオリーは特定の知識分野に特化していて、その中では矛盾がないように設計されています。この分割は、AIが推論する際の「探索範囲」を絞り込み、効率を良くするために重要な役割を果たします。

推論エンジン：知識から答えを導き出すAIの頭脳

Cycの推論エンジンは、知識ベースから答えを導き出すためのコンピュータプログラムです。一般的な論理的な推論（演繹）だけでなく、帰納推論や統計的・記号的機械学習、アブダクション推論なども実行できます。

Cycはどんなことに使われたの？

Cycは、その汎用的な常識知識と推論能力を活かして、様々な分野で応用が試みられました。

医療分野: クリーブランド・クリニックでは、心臓外科に関する医学情報の自然言語での質問応答システムにCycが使われ、研究者が質問に答える時間を大幅に短縮できました。
セキュリティ・情報統合: アメリカの諜報機関と協力して、「テロリズム知識ベース」の構築に利用され、異なる情報源からの情報を統合する試みが行われました。
教育分野: 小学6年生の算数を学ぶ生徒を支援する「MathCraft」というアプリが開発されました。Cycが少し戸惑っている生徒の役を演じ、ユーザーが良いアドバイスをするほど、Cycのアバターが間違いを減らしていくというユニークなものでした。
検索エンジンの改善: Lycosという検索エンジンが、検索語の曖昧さを解消するためにCycを使いましたが、2001年に中止されました。

これらの事例は、Cycが大量の情報を整理し、論理的に関連付ける能力を持っていたことを示しています。しかし、これらの商業利用は、既存の「エキスパートシステム」や「データ統合」と機能的に同じであり、「Cycが主張する高い知能が競争優位性をもたらした証拠はない」という批判もあります。つまり、Cycは「賢い情報管理システム」としては機能しましたが、「人間のように考えるシステム」としてはまだ不十分だった、と言えるかもしれません。

Cycが直面した課題と批判

Cycプロジェクトは、その壮大な目標と長い取り組みにもかかわらず、多くの課題と批判に直面しました。

「脆さ」と「フレーム問題」の壁

Cycは、エキスパートシステムの「脆さ」を克服しようとしましたが、Cyc自身も「固定された知識セットに基づくシステム」として、その「脆さ」から完全に逃れることはできませんでした ⁸。Cycは、知っている範囲内ではうまく機能するものの、常識的な知識や行動の推論が必要な状況では失敗する傾向があったのです。これは、手作業で入力された知識だけでは、現実世界の無限の多様性や曖昧さに対応しきれないという、シンボリックAIの根本的な限界を示しています。

また、大規模なシンボル構造の情報を現実的な時間内に更新したり、検索したり、操作したりする「フレーム問題」も、CycのようなシンボリックAIにとって大きな課題でした ⁵。

手作業による知識入力の限界

Cycの知識ベースは、主に「オントロジーエンジニア」（哲学の博士号を持つ人々）による手作業での知識入力によって構築されました。これは、自然言語を高度な論理形式に変換し、CycLに翻訳するという、非常に骨の折れる作業でした。レナト氏は、Cycが自分で文章から学習できるようになるまでに、1億のアサーションが必要で、これには約200人年分の作業が必要だと見積もっていました。しかし、この手作業のペースでは、目標達成は極めて困難であり、「必要なデータの量が際限なく多い」「システムが自力で進化できない」という批判につながりました。

AIコミュニティからの評価と論争

Cycプロジェクトは、AIの歴史において「最も議論の的となった取り組みの一つ」と評され、一部の研究者からは「壊滅的な失敗」とまで言われることもありました。多くのAI研究者は、Cycプロジェクトを「間違ったアプローチに費やされた途方もない努力の教訓」と見なし、機械学習やディープラーニングのブレークスルーによって、その存在感が薄れていきました。

アカデミアからは、Cycシステムが「使いにくい」とされ、公開された性能評価も少なく、学術研究での利用は最小限でした。また、Cycは「閉鎖的で秘密主義的な性質」も批判の対象となりました。オープンソースやオープンサイエンスが主流となる中で、その情報が外部の研究者や一般にほとんど公開されなかったことが、信頼性や発展の機会を阻害したと指摘されています。

Cycの「失敗」という評価は、その壮大な目標（汎用人工知能AGIの達成）が未達であったことに起因するものであり、特定の商業利用における限定的な成功や技術的貢献とは切り離して考える必要があります。

現代AIとの比較：Cycの遺産と未来

Cycは、AI研究の歴史の中で特別な位置を占めています。そのアプローチは、現代の主流である機械学習や大規模言語モデル（LLM）とは大きく異なります。

シンボリックAIとしてのCycと、機械学習・LLMの違い

Cycは、明示的なルールと論理に基づいてシンボルを操作する「シンボリックAI」（古き良きAI、GOFAIとも呼ばれる）の代表例です。これに対し、現代のAI、特に機械学習や大規模言語モデル（LLM）は、膨大なデータからパターンを学習し、予測を行う「統計的AI」アプローチに属します。

両者のアプローチには根本的な違いがあります。簡単に比較してみましょう！

比較項目	シンボリックAI (Cyc)	現代機械学習・LLM
基本的な考え方	明示的なルールと論理で、記号を操作する。	膨大なデータから統計的なパターンを学習し、予測する。
知識の表現	人間が定義したルール、論理式、事実。中身が「透明な箱」。	データの統計的パターン、ニューラルネットワークの重み。しばしば「ブラックボックス」。
学習方法	主に人間が手作業で知識を入力。新しいルールは明示的にプログラムが必要。	大量のデータから自動で学習。新しいパターンを自律的に見つけ、適応する。
推論の仕方	論理的な推論が中心。推論の過程を一つずつ追跡できる。	データ内の相関関係に基づくパターン認識と予測。内部の推論過程は追跡が難しい。
説明のしやすさ	高い。なぜその結論に至ったか、論理的に説明できる。	低い。なぜその出力になったか説明が難しいことが多い。
得意なこと	構造化された問題解決、計画、厳密な論理的推論、データ統合。	自然言語の理解・生成、画像認識、翻訳、曖昧なデータの処理。
苦手なこと／限界	曖昧さ、不確実性、生データの処理、常識の網羅、手作業による拡張性、脆さ。	論理的推論の欠如、事実の不正確さ（「ハルシネーション」）、一貫性の欠如。
代表例	Cyc、初期のエキスパートシステム。	ChatGPTなどのLLM、画像認識モデル。

ハイブリッドAIの可能性：CycとLLMの融合

ChatGPTのようなLLMは、人間らしい自然な文章を生成できますが、時々一貫性がなかったり、不正確だったり、「ハルシネーション」（幻覚のように誤った情報を生成すること）を起こしたりすることがあります。また、その推論過程は「ブラックボックス」で、なぜその答えが出たのかが分かりにくいという問題もあります。

このようなLLMの弱点に対し、CycのようなシンボリックAIが持つ「明示的な知識」と「論理的な推論能力」が、LLMを補完する役割を果たす可能性が指摘されています。Cycは、ステップバイステップで推論の過程を「監査可能」（つまり、なぜそう判断したのかを説明できる）に提供できるため、LLMの信頼性や予測可能性、説明のしやすさを向上させるのに役立つと考えられています。

Cycの創設者であるダグラス・レナト氏自身も、晩年にはCycとLLMの強みを組み合わせた「ハイブリッドAIシステム」の可能性を提唱していました。これは、「論理的で明晰なCyc（左脳的）」と、「もっともらしく自然なLLM（右脳的）」を統合することを目指すものです。

AI研究は、シンボリックAIと統計的AIの間で、まるで振り子のように揺れ動いてきました。CycはシンボリックAIの究極の形とも言えるプロジェクトでしたが、その限界が明らかになりました。しかし、LLMが新たな問題に直面する中で、Cycが提供する「論理的推論」や「監査可能性」が再評価されるようになっています。これは、一つのアプローチだけでは真の汎用知能には到達できない、という認識に基づいています。

まとめ：Cycプロジェクトから何を学ぶか

Cycプロジェクトは、AIに「常識」を与えるという壮大な夢を追いかけ、40年近くにわたる途方もない努力を費やしてきました。目標であった人間レベルの汎用知能の達成には至りませんでしたが、AI研究の歴史に重要な足跡を残しました。

Cycは、明示的な知識表現と論理的推論の可能性と限界を実証しました。特に、手作業での知識入力の難しさ、知識の「脆さ」、そして現実世界の曖昧さへの対応の難しさを浮き彫りにしました。一方で、Cycの「論理的マッピング」は現代の「知識グラフ」に似ていて、その推論能力は特定の専門分野でのデータ統合や複雑な問題解決の補助に役立つことを示しました。

Cycの遺産は、現代のAI研究、特にLLMの限界が明らかになる中で再評価されています。その「信頼性」と「説明のしやすさ」は、今後のAIシステムに求められる重要な特性として注目されており、シンボリックAIと統計的AIの融合という「ハイブリッドAI」の探求へとつながっています。

Cycの歴史は、AIの進歩が予測不可能であり、ルールベースのシステムが将来再び重要な役割を果たす可能性があることを示唆する「教訓」として、AI研究者に学びを提供し続けています。

AIの進化はこれからも目が離せませんね！

Cycプロジェクトのように、一見遠回りに見える研究が、未来のAIの形を大きく変える可能性を秘めているのかもしれません。

【電子復刻版】bit 1994年03月号(通巻301号)

Amazon（アマゾン）

「Cycプロジェクト」って何？ 常識をAIに教え込む壮大な挑戦！