Claude Mythos Preview は、Anthropic が開発した最新かつ最強のフロンティアAIモデルであり、Opus 4.6 など従来の Claude モデルを大きく超える飛躍を示しています。2026年4月7日に Project Glasswing の一環として発表され、エージェント型コーディング、複雑な推論、特にサイバーセキュリティ分野で前例のない能力を持つ汎用言語モデルです。
従来の Claude モデルとは異なり、Mythos Preview は厳しく制限された研究プレビュー段階にあり、一般公開されていません。その理由は、主要OSやブラウザ、基盤ソフトウェアにおけるゼロデイ脆弱性を含む重大な脆弱性を自律的に発見し、連鎖的に悪用できる能力を持つためです。
通常ユーザーには、Claude API の利用として CometAPI の使用が推奨されます。複数分野の強力なモデルを統合し、従量課金制で公式より低価格のAPIを提供しています。
Claude Mythos Preview とは?
Claude Mythos Preview は Anthropic のこれまでで最も高度なAIモデルであり、「Mythos」クラスとして既存の Opus を上回る位置付けです。Constitutional AI の原則を継承しつつ、特に自律エージェント能力において質的な飛躍を実現しています。
主な特徴:
- エージェント自律性:バグ仮説→テスト→デバッグ→PoC生成をほぼ自動で実行
- スケールと効率:巨大コードベースや長文コンテキストを処理
- サイバーセキュリティ能力:主要OS・ブラウザ全体で数千件の脆弱性を発見
なぜ一般公開されていないのか?
Anthropic は意図的に一般公開を見送りました。理由は明確で、このモデルは攻撃的サイバーリスクが極めて高いためです。
- 非専門家でも短時間でエクスプロイト生成可能
- 小規模企業ネットワークへの自動攻撃
- サイバー犯罪の拡大
その代わりに Project Glasswing を開始し、防御目的で限定パートナーに提供しています。
ベンチマーク概要
プログラミング性能
- SWE-bench Verified:93.9%
- SWE-bench Pro:77.8%
- Terminal-Bench:82.0%
→ 単なるコード生成ではなく「ソフトウェアエンジニアとして機能」
推論能力
- GPQA Diamond:94.6%
- Humanity’s Last Exam:64.7%
セキュリティ能力
- CyberGym:83.1%
→ 脆弱性の発見・再現・攻撃理解が可能
仕組み:脆弱性発見と攻撃チェーン
典型的な流れ:
- 隔離環境でコード実行
- バグ仮説生成
- テスト・デバッグ
- PoC生成
実例:
- OpenBSD の27年前の脆弱性
- FFmpeg の16年前のバグ
- Linux カーネル権限昇格
利用ケース
- 脆弱性スキャン
- ペネトレーションテスト
- パッチ開発
- ブラックボックス解析
誰が使えるのか?
現在は以下のみ:
- AWS、Apple、Google、Microsoft など主要企業
- 約40の追加組織
一般ユーザーは利用不可
一般ユーザーへの影響
現時点では利用不可ですが、将来的に安全版が公開予定です。
現状は Claude 4 系列(Opus / Sonnet)を使用することになります。
結論
Claude Mythos Preview は単なる進化ではなく、AIの能力を再定義する存在です。同時に安全性の問題も提起しています。現在は限定的に防御用途で使用されており、一般公開はされていません。