コードネーム GPT-5.3「Garlic」 は、リーク情報および関連報道によれば、GPT-5.x 系列における次の段階的・反復的リリースとして位置付けられている。本モデルは、推論能力、コーディング性能、プロダクト全体の完成度における既存のギャップを埋めることを目的としており、Google の Gemini および Anthropic の Claude からの競争圧力に対する OpenAI の戦略的対応とされている。
OpenAI は、単純にパラメータ数を拡大し続けるのではなく、より高密度かつ効率的な GPT-5.x の新イテレーションを試験している。重点は、より強力な推論能力、高速な推論処理、長文コンテキストに対応したワークフローにある。これは単なる Generative Pre-trained Transformer シリーズの延長ではなく、明確な戦略的反攻である。
2025年12月、CEO サム・アルトマンによって社内で宣言された「Code Red(非常事態)」を起点として誕生した「Garlic」は、過去およそ5年間にわたり LLM 開発を支配してきた「大きければ良い」という思想を否定する存在である。その代わりに提示された新たな評価軸が、「認知密度(Cognitive Density)」である。
GPT-5.3「Garlic」とは何か?
GPT-5.3(コードネーム「Garlic」)は、OpenAI の GPT-5 ファミリーにおける次の反復的進化として説明されている。リークを伝える情報源は、Garlic を単なるチェックポイント更新やトークン調整ではなく、アーキテクチャおよび学習手法を的確に洗練させたモデルであると位置付けている。
その目的は、モデル規模の単純な拡大に依存することなく、よりコンパクトで推論効率の高いモデルから、高度な推論性能、優れた多段階プランニング能力、長文コンテキスト処理能力を引き出すことである。この方向性は、業界全体で進行している「高密度」あるいは「高効率」モデル設計への潮流とも一致している。
「Garlic」という名称は、従来の天文学的(Orion)あるいは甘味を想起させる植物系(Strawberry)コードネームとは大きく異なり、意図的に選ばれた内部メタファーだとされる。ニンニク一片が、量の多いが味の薄い素材よりも料理全体に強い風味を与えるように、このモデルは業界最大級の計算コストを必要とせず、凝縮された知能を提供することを狙っている。
「Code Red」の誕生背景
Garlic の存在は、それを生み出した危機的状況と切り離して語ることはできない。2025年後半、OpenAI は ChatGPT の登場以来初めて、防御的立場に立たされることとなった。Google の Gemini 3 はマルチモーダル分野のベンチマークで首位を獲得し、Anthropic の Claude Opus 4.5 は高度なコーディングおよびエージェント型ワークフローにおける事実上の標準となっていた。
これに対応するため、OpenAI の経営陣は広告プラットフォーム実験やコンシューマー向けエージェント拡張といった周辺プロジェクトを一時停止し、競合に対して「戦術的打撃」を与え得るモデルの開発に全リソースを集中させた。Garlic は、その打撃として設計されたモデルである。
Garlic は世界最大のモデルを目指しているわけではない。1パラメータ当たりで最も賢いモデルになることを目標としている。過去の内部研究プロジェクト、特に「Shallotpeat」の成果を統合し、バグ修正や事前学習効率の改善を取り入れることで、実際の規模を大きく上回る性能を発揮する設計となっている。
GPT-5.3 の現在の開発状況
2026年1月中旬時点で、GPT-5.3 は社内検証の最終段階、いわゆる「ハードニング」フェーズに入っている。モデルはすでに内部ログ上で確認されており、厳格な NDA(秘密保持契約)のもと、限定されたエンタープライズパートナーによるスポットテストも実施されている。
観測されたイテレーションと「Shallotpeat」の統合
Garlic への道のりは直線的なものではなかった。研究責任者マーク・チェンによる内部メモのリークによれば、Garlic は実際には二つの異なる研究路線を統合したハイブリッドモデルである。
当初 OpenAI は、「Shallotpeat」というコードネームのモデルを、直接的な段階更新として開発していた。しかし Shallotpeat の事前学習過程において、研究者たちは推論パターンを「圧縮」する新しい手法を発見した。これは、学習の早い段階で冗長なニューラル経路を意図的に排除するというものである。
この発見により、Shallotpeat の単独リリースは中止され、そのアーキテクチャはより実験的な「Garlic」ブランチへと統合された。その結果、成熟した GPT-5 系モデルの安定性と、新アーキテクチャによる爆発的な推論効率を併せ持つハイブリッドイテレーションが誕生した。
リリース時期はいつか?
OpenAI のリリース時期予測は困難であることで知られているが、「Code Red」体制のもとでは通常のスケジュールが大幅に加速している。リーク情報、ベンダー動向、競合サイクルを総合すると、以下のリリース時期が有力視されている。
主なリリースウィンドウ:2026年Q1(1月〜3月)
関係者の間では、2026年第一四半期のリリースがほぼコンセンサスとなっている。2025年12月に Code Red が宣言され、「可能な限り早く」公開する指示が出されたことを踏まえると、2026年1月下旬から2月初旬の公開が最も現実的と考えられている。
ベータ(段階的)ロールアウト
-
2026年1月下旬:一部パートナーおよび ChatGPT Pro ユーザー向けプレビュー版(「GPT-5.3 Preview」表記の可能性)
-
2026年2月:API の全面提供
-
2026年3月:無料版 ChatGPT への統合(回数制限あり)
GPT-5.3 を特徴づける要素
噂が事実であれば、GPT-5.3 は純粋な生成能力よりも、実用性および統合性を重視した機能群を導入する。
1. 高密度事前学習(EPTE)
Garlic の中核的要素は Enhanced Pre-Training Efficiency(EPTE) である。従来モデルが大量データを通じて広範な関連性を構築するのに対し、Garlic は学習中に情報を能動的に「剪定」し、凝縮するフェーズを持つ。
-
結果:VRAM 要件は小さいまま、大規模モデル並みの世界知識を保持
-
利点:推論速度の向上と API コストの大幅削減
2. ネイティブなエージェント推論
Garlic は、外部ラッパーや複雑なプロンプト設計を必要とせず、エージェントとして動作するネイティブ機能を備えている。API 呼び出し、コード実行、データベースクエリは、モデルの語彙における「第一級市民」として扱われる。
このモデルは単にコードを書けるだけでなく、コードが動作する環境そのものを理解している。ファイルディレクトリの操作、複数ファイルの同時編集、外部オーケストレーションスクリプトなしでのユニットテスト実行が可能とされる。
3. 大規模コンテキストおよび出力ウィンドウ
Garlic は、Google Gemini の100万トークン級コンテキストに対抗するため、40万トークンのコンテキストウィンドウを備えると噂されている。サイズでは劣るものの、新しい注意機構により、2025年世代モデルに見られた「コンテキスト中央部の情報欠落」を防ぐ「完全記憶」を実現するとされる。
さらに、出力上限は128,000トークンに拡張される見込みであり、ソフトウェアライブラリ全体、包括的な法的文書、長編小説を一度の生成で出力可能となる。
4. 幻覚(ハルシネーション)の大幅削減
Garlic は「認識論的謙虚さ(epistemic humility)」に焦点を当てた事後学習強化手法を採用している。モデルが「自分の知らないことを知る」よう厳密に訓練されており、内部テストでは GPT-5.0 を大きく下回る幻覚率が確認されている。これにより、バイオメディカルや法務といった高リスク分野での利用が現実的になる。
競合モデルとの比較
Garlic の成功は単独ではなく、現在市場を支配する二大モデル、Google Gemini 3 と Anthropic Claude Opus 4.5 との直接比較によって測られる。
GPT-5.3「Garlic」vs Google Gemini 3
規模と密度の対決
-
Gemini 3:動画・音声・画像生成を含むマルチモーダル理解に優れ、事実上無制限のコンテキストを持つ「万能型」モデル
-
GPT-5.3 Garlic:マルチモーダルの幅では競わず、純粋な推論精度、コード論理、複雑な指示追従性において Gemini を上回ることを狙う
結論:3時間の動画分析は Gemini、銀行アプリのバックエンド実装は Garlic。
GPT-5.3「Garlic」vs Claude Opus 4.5
開発者の心を巡る戦い
-
Claude Opus 4.5:人間に読みやすいコードと高い指示遵守性で評価されるが、コストが高く動作が遅い
-
GPT-5.3 Garlic:Opus と同等のコーディング性能を、2倍の速度・半分のコストで提供することを目標とする
結論:「Code Red」は Opus 4.5 のコーディング分野支配によって引き起こされた。Garlic が成功するかどうかは、開発者が再び OpenAI に API キーを戻すかにかかっている。
指標と評価
Garlic の初期内部ビルドは、以下の高付加価値領域において Gemini 3 および Claude Opus 4.5 をすでに上回っているとされる。
-
コーディング能力:GPT-4.5 と比較して論理ループに陥る傾向が低い
-
推論密度:o1(Strawberry)系列よりも少ない思考トークンで正解に到達
| 指標 | GPT-5.3(Garlic) | Gemini 3 | Claude 4.5 |
|---|---|---|---|
| 推論(GDP-Val) | 70.9% | 53.3% | 59.6% |
| コーディング(HumanEval+) | 94.2% | 89.1% | 91.5% |
| コンテキスト | 400K | 2M | 200K |
| 推論速度 | 超高速 | 中程度 | 高速 |
結論
「Garlic」は、推論密度、効率性、実運用ツールを最優先する OpenAI の現実的かつ戦略的なエンジニアリング路線を示す、信憑性の高い噂である。その登場は、OpenAI・Google・Anthropic 間で加速するモデル競争の文脈で理解されるべきであり、そこでは単なる性能ではなく、「1ドル・1ミリ秒あたりの有用な性能」が最大の価値となる。
この新モデルに関心がある場合は CometAPI をフォローするとよい。CometAPI は、最新かつ高品質な AI モデルを、公式価格よりも低コストで提供している。
開発者は現在、CometAPI を通じて GPT-5.2、Gemini 3、Claude 4.5 にアクセス可能である。Playground でモデル機能を確認し、API ガイドを参照することで導入を開始できる。利用前に CometAPI へログインし、API キーを取得しておく必要がある。
今すぐ始める? → CometAPI に登録しよう。
AI に関する最新情報、ガイド、ニュースを知りたい方は、VK、X、Discord でもフォローを。