GPT-5.6 Sol登場: 米政府承認の20社だけが使えるOpenAI最新AIの全容
OpenAIのSam AltmanはGPT-5.6発表のブログで、「長期的なデフォルトにすべきではない」と批判しながらも米政府の要請に応じて限定公開を選んだと明かした(TechCrunch)。
2026年6月26日、OpenAIはGPT-5.6ファミリーとして3モデルを発表した。フラッグシップのSol、バランス型のTerra、大量処理向けのLunaだ。Terminal-Bench 2.1ではSol UltraがClaude Mythos 5(88.0%)を91.9%で上回ったとされるが、一般開発者が試せるのは「数週間後」で、しかも米政府が事前に審査した約20社のみへの提供が先行する。
- OpenAI最新モデルを業務に組み込むか判断したいエンジニア・PM
- Claude・GPT-5.5からの移行コストを見積もりたいAPIユーザー
- 米政府の「フロンティアAI事前審査」という規制動向を把握したいビジネスパーソン
3モデルのスペックと価格
GPT-5.6は用途別に3つの価格帯を用意した。
| モデル | 主な用途 | 入力 | 出力 |
|---|---|---|---|
| Sol | フラッグシップ・エージェント | $5/MTok | $30/MTok |
| Terra | 日常業務・コスト効率 | $2.50/MTok | $15/MTok |
| Luna | 大量処理・低コスト | $1/MTok | $6/MTok |
SolはOpenAIが最上位と位置づけるフラッグシップモデルで、コーディング・生物学・サイバーセキュリティでの能力向上を強調している。ultra mode(後述)では最大64のサブエージェントを並列起動できる。
TerraはGPT-5.5と同等スコアながらコストが約半額。入力$2.50/MTok・出力$15/MTokという価格帯はClaude Sonnet 4.6(入力$3/MTok・出力$15/MTok)と真正面から競合する。入力処理が多いRAG(外部文書を検索してAIに渡す手法)やドキュメント要約ではTerraが$0.50/MTok有利になる計算だ。
Lunaは$1/$6/MTokで主要LLMの低コスト帯を狙う価格設定だ。ログ分類・バッチ翻訳・大量データ前処理向けの位置づけだ(OpenAI公式)。
キャッシュ仕様も一新した。従来は推論エンジンが自動判断していたキャッシュポイントを、開発者が「キャッシュブレークポイント」として明示的に指定できるようになった。30分間のキャッシュ保持が最低保証され、書き込みは未キャッシュ入力料金の1.25倍、読み込みは90%割引を継続する。
Terminal-Bench 2.1でClaudeを超えたか: ベンチマークの読み方
OpenAIが公開したTerminal-Bench 2.1(コマンドライン・エージェント評価)のスコア比較だ。
| モデル | スコア |
|---|---|
| GPT-5.6 Sol Ultra | 91.9% |
| GPT-5.6 Sol | 88.8% |
| Claude Mythos 5 | 88.0% |
| GPT-5.6 Terra / Claude Fable 5 | 84.3%(同率) |
| GPT-5.5 | 83.4% |
| Gemini 3.1 Pro Preview | 70.7% |
Sol UltraがMythos 5を3.9ポイント上回る結果だが、2点の留保がある。第一にこのベンチマークはOpenAI自身が実施したもので独立機関の検証を経ていない。第二にClaude Mythos 5は米政府の輸出規制でアクセスが制限されており、最新チェックポイントとの比較でない可能性がある(The Decoder)。
Hacker Newsでは「750トークン/秒という速度は本物なのか」という注目コメントと、「また自社有利なベンチマーク」という懐疑論が混在した(HN #48689028)。
ultra modeとmax reasoning effort: 何が違うか
GPT-5.6で最も技術的に注目すべき追加機能がultra modeだ。Solのみに搭載されており、単一エージェントの推論を超えて最大64のサブエージェントを並列起動し、複雑なタスクを分散処理する。
既存のmax reasoning effortは「同じ1つのモデルにより長く考えさせる」設定だ。ultra modeは「複数の独立したエージェントが問題を分割して同時進行させる」アーキテクチャで、実行時間を短縮しながら推論の複雑性を引き上げられる。
プレビュー実証では法的文書分析や複雑なDevOps自動化でGemini 3.1やMythos 5を上回る結果が報告されているが、これも現時点では限定パートナーのみが試せる段階だ(MarkTechPost)。
なぜ20社だけか: フロンティアAI「政府事前審査」という新たな先例
OpenAIはGPT-5.6の限定公開を強いられたことについて、「ユーザー、開発者、企業、サイバー防衛担当者、グローバルパートナーから最良のツールを遠ざけることになる」と政府批判とも読める声明を発表した(Axios)。
今回の制限を要請したのは米国家サイバー局長室(ONCD)と科学技術政策局(OSTP)だ。GPT-5.6 Solのサイバーセキュリティ能力がClaude Mythos 5と同等水準と判断され、政府が承認した約20組織へのみの先行提供となった(CNN)。
これは孤立した出来事ではない。同時期に米商務省はAnthropicに対してFable 5とMythos 5の一般アクセス停止を命じる輸出管理指令を発動した(詳細記事)。「フロンティアモデルを政府が事前審査してから公開する」という慣行が、米国AI業界の新たな規範になりつつある。Sam Altmanはこれを「持続不可能」と明言し、業界全体での代替策を模索するとした。
Claude・GPT-5.5との現実的な比較
価格帯の観点で開発者が最も気にするのはTerraとClaude Sonnet 4.6の比較だろう。出力コストは同じ$15/MTokだが入力はTerraが$0.50安い。大量ドキュメントを入力するRAGシステムでは月間コストに差が出てくる。
Solは現在使えない。「GPT-5.6 Sol vs Claude Opus 4.8」という対決は、広範囲公開後まで棚上げだ。一般開発者が今日APIで選べるフラッグシップは依然としてClaude Opus 4.8かGPT-5.5という状況が続く。GPT-5.5からTerraへの移行は価格面では魅力的だが、キャッシュブレークポイントAPIなど新仕様への対応コードの書き直しが発生する可能性がある(VentureBeat)。
6月だけで、AnthropicのMythos/Fable輸出規制とOpenAIのGPT-5.6限定公開という2件の「政府主導アクセス制限」が起きた。背景には中国AI企業による蒸留攻撃(偽アカウントでの大量照会)への対抗という文脈がある。フロンティアAIの開発競争は、商業競争から安全保障競争へ変容しつつある。開発者は「最強モデルを試せる」前提が崩れることを想定した調達・評価計画が必要だ。
GPT-5.6の前世代にあたるGPT-5.5の詳細はGPT-5.5完全ガイドで解説している。AnthropicとOpenAIの事業戦略の違いはAnthropicとOpenAIのビジネスモデル比較を参照。Mythos輸出規制の経緯はAnthropic Mythos輸出規制の全経緯で読める。
関連記事
本記事に記載のベンチマークスコアはOpenAIが自社で実施したものであり、独立機関による検証を経ていない。価格・モデル仕様・提供範囲は2026年6月時点の情報に基づき、予告なく変更される可能性がある。GPT-5.6の一般公開時期はOpenAIの発表に基づくが、米政府の方針変更により変わる場合がある。本記事は特定サービスの選択を推奨するものではない。