Gemini 3.5 Pro 完全ガイド|2Mトークン・Deep Think・GA遅延の深層【2026年6月】
「来月」。2026年5月19日のGoogle I/O基調講演でSundar Pichai CEOがその一言を発した瞬間、会場に「audible groans(失望のため息)」が漏れた。(出典:Let’s Data Science「Google delays Gemini 3.5 Pro」、2026年5月)
そして「来月」は今月になった。6月19日現在、Gemini 3.5 ProはVertex AIの限定プレビューに留まり、一般提供(GA)の日程は未発表のままだ。
2Mトークンのコンテキストウィンドウ、Deep Thinkの新世代推論、フロンティアのマルチモーダル理解。Google I/Oで予告された仕様は破格だが、今もほとんどの開発者はそれを試せていない。GA後も価格と制限によって、全員にとっての「使えるモデル」にはならないかもしれない。
- Gemini 3.5 ProのGA待ちで代替モデルを検討しているエンジニア・PM
- Claude Opus 4.8・GPT-5.5との違いと使い分けを判断したい開発者
- 2Mトークンコンテキストと Deep Think を業務に使えるか評価したい技術選定担当
- Google AI Ultraの新プラン($99.99〜$199.99/月)への移行コストを試算したい企業担当者
Gemini 3.5 Proとは何か
2026年5月19日のGoogle I/O基調講演で、Sundar Pichai CEOは短くこう述べた。
「3.5 Proの開発を急ピッチで進めている。すでに社内で使っており、来月には展開できると思っている」
(出典:Sundar Pichai at Google I/O 2026 keynote、2026年5月19日)
Google Cloud CEOのThomas KurianもGoogle Cloud Blogで「Gemini 3.5 Proは現在テスト中であり、来月リリース予定」と同日に補足した(出典:Google Cloud Blog「Innovations from Google I/O 26」、2026年5月20日)。
公表されている主な仕様:
| 項目 | Gemini 3.5 Pro |
|---|---|
| コンテキストウィンドウ | 200万トークン |
| 推論モード | Deep Think(マルチパス並列推論) |
| 対応モダリティ | テキスト・画像・音声・動画 |
| アーキテクチャ | Transformer MoE(前世代から継承) |
| 現状 | Vertex AI限定プレビュー(GA未達) |
(出典:AI/ML API Blog「Gemini 3.5 Pro: Everything You Need to Know」、TechTimes 2026-06-06)
前世代のGemini 3.1 Proも2Mトークンのコンテキストを持つが、3.5 ProではDeep Thinkと組み合わせることで長大なドキュメントやコードベースを「多段階推論で処理」する設計が新しい。またGemini 3 Deep Thinkで実装されたSystem 2思考の後継として位置づけられる。
なぜ6月半ばになってもGA未達なのか
「googleが3.5 proについて不気味なほど沈黙している」。Xで@haider1がそう指摘したのは6月17日だ(原文)。翌18日には@scaling01が「3.5 Proのプット(空売り)はどこで買える?6月中旬に出ると言っていなかったか」と皮肉った(原文)。
TokenMix Blogは5月27日時点での状況をこう記録している。「Googleはモデルカードも、API料金も、ベンチマークも公開していない。Flash発表時の透明なアプローチとは対照的だ」(TokenMix Blog)。
GA遅延の背景には複数の要因が重なっている。
1. 安全性強化の検証が長期化 Googleは3.5系にサイバー攻撃対策とCBRN(化学・生物・放射線・核)の安全性強化を実装した。AnthropicがFable 5で経験した輸出規制問題を反面教師に、Googleが慎重に安全性検証を進めているとみられる。
2. 規制当局からの圧力 英国議会の60人超の議員が、Gemini 2.5 Proの安全性レポート遅延についてGoogle DeepMindを「信頼違反」と批判していた(Yahoo News)。3.5 Proでの類似リスクを避ける動機がある。
3. フラッシュ先行のストーリー設計 Gemini 3.5 Flashが「Proを超えるFlash」として話題をさらった後でProを出すことで、より高い期待値を演出する戦略とも読める。
4. インフラ容量の制約 Gemini 3.1 Pro Previewは4月15日に503/504エラーが多発し、Googleのインフラチームが「急増する需要への対応に苦慮している」と認めた(Google AI Developers Forum)。3.5 Proの段階的展開はこの教訓を踏まえている。
Polymarketでは「6月30日までにGA達成」の確率が50〜55%と算出されている(2026年6月19日時点)。半々に近い数字が、Googleが公式発表なしに月末を迎えるかもしれないという不確実性をよく表している。
既存モデルとの比較
Gemini 3.5 Pro自体のベンチマークは未公開だ。公式モデルカードも、API料金も、GoogleはGA前の段階では一切発表していない(出典:TokenMix Blog)。比較の出発点として、直接競合する3モデルとGemini 3.5 Flashの既知スコアを参照する。
| モデル | コンテキスト | GPQA Diamond | 特徴 |
|---|---|---|---|
| Gemini 3.5 Pro(未GA) | 2Mトークン | 未発表 | Deep Think・マルチモーダル重点 |
| Gemini 3.1 Pro | 2Mトークン | 94.1% | 現行フラッグシップ・GA済み |
| Gemini 3.5 Flash | 1Mトークン | 未公開 | Terminal-Bench 76.2%・289tok/s |
| Claude Opus 4.8 | 200Kトークン | 未公開 | Agentic Index 1位・エージェント特化 |
| GPT-5.5 | 1Mトークン | 未公開 | SWE-Bench Pro 58.6% |
(出典:GPQA Leaderboard June 2026 / PricePerToken、AI/ML API Blog)
Claude Opus 4.8との実用的な差
Claude Opus 4.8(2026年5月28日GA)はArtificial Analysis Agentic Indexでエージェント系タスクのトップを維持している。200Kトークンという制約はあるが、コーディングと多段階エージェント実行では現時点での最強モデルだ。Claude Opus 4.8の完全ガイドでも詳述しているが、「使えるフラッグシップ」として開発者に選ばれている。
Gemini 3.5 Proが仮に3.1 Proを大幅に超えるならば、2Mトークンの長文コンテキスト処理とマルチモーダルタスクでClaude Opus 4.8を上回る可能性がある。@haider1が「3.5 flashが蒸留された元モデルがあるとすれば、非常に強いはずだが、Fable 5には及ばないかもしれない」と述べたように(X 2026-06-17)、コミュニティの期待は高いが懐疑的な目線も共存している。
料金予測とアクセス方法
価格予想
Googleは2026年6月19日時点でGemini 3.5 ProのAPI料金を一切公表していない。流通している推定値は2系統ある。
強気予測(byteiota.com、aiweekly.co): 入力$15/MTok、出力$60/MTok — Gemini 3.5 Flashの約10倍
保守予測(byteiota.com別記事): 入力$2/MTok、出力$12/MTok — Gemini 3.1 Proと同水準で、2Mトークン超の長文はその1.5〜2倍
参考として現行Gemini料金(確定):
| モデル | 入力/MTok | 出力/MTok |
|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 |
| Gemini 3.1 Pro | $2.00 | $12.00 |
| Gemini 2.5 Pro(〜200K) | $1.25 | $10.00 |
(出典:Vertex AI pricing page、直接確認2026年6月)
注意点として、Deep Thinkモードを使うと「推論トークン」がすべて出力トークン料金で課金される。深い推論プロンプトでは出力トークンの95%以上が推論トークンになる場合もある(Verdent Gemini pricing guide)。
アクセス方法(現在)
企業向け: Vertex AI Model Gardenで「gemini-3.5-pro」と検索し、Googleクラウドアカウントチームを通じてアクセスを申請。
一般開発者: GA後はaistudio.google.comのモデル選択画面に追加される予定。Pro以上のモデルは有料のCloud Billingが必要(無料枠対象外)。
コンシューマ向け(日本): AI Proプラン(¥2,900/月)でGemini 3.5 Proへのアクセスが期待されるが、Deep ThinkはAI Ultraプラン(¥14,500/月〜)限定とみられる(Jetstream Blog)。
今すぐ使うべきか、待つべきか
6月19日現在のGA未確定という状況を踏まえ、判断基準を整理する。
Gemini 3.5 ProのGAを待つべきケース:
- 2Mトークンの長文コンテキストとDeep Thinkの組み合わせが必須(法務文書全体の多段階解析、巨大コードベースの横断的理解など)
- Googleエコシステム(Vertex AI・Antigravity・Workspace)に完全ベットしており、最新フラッグシップを待てる余裕がある
- 月末まで待ってもプロジェクトスケジュールに影響がない
今すぐ代替モデルで動くべきケース:
- コーディング・多段階エージェント: Claude Opus 4.8が現時点の最優解(Artificial Analysis Agentic Index首位)
- 速度とコスト重視: Gemini 3.5 Flash(289tok/s・$1.50/$9 per MTok)
- 2Mトークンだけが必要: Gemini 3.1 Pro(GA済み・$2.00/$12.00 per MTok)
ShiftBは「大規模コーディングや正確性が必要な場面ではClaude Opus 4.8、高速応答やコスト重視ではGemini 3.5 Flash」と推奨する(ShiftB 2026年5月)。ChatForestも「今Flashでビルドするか、Proのリリースを待つか」のフレームワークを提示した(ChatForest)。
Polymarketの50〜55%という確率が示す通り、月末GA達成は不確実だ。コア機能が競合で代替できるチームは、いま待機を選ぶ理由は薄い。
Gemini 3.5 ProはGA未達のため、本記事の仕様・料金・ベンチマーク情報のうち公式発表済みでない部分は推計・予測・コミュニティ情報に基づく。GA後にGoogleが公式情報を発表し次第、内容を更新する。
関連記事を読む
- Gemini 3.5 Flash GA完全レビュー — 今すぐ使えるGemini 3.5系の現状
- Google I/O 2026まとめ — 発表の全体像
- Claude Opus 4.8完全ガイド — GA済みフラッグシップの現状最有力候補
- Gemini 3 Deep Thinkガイド — Deep Thinkの技術的背景と評価
免責事項: 本記事の情報は2026年6月19日時点のものです。Gemini 3.5 ProはGA未達であり、仕様・料金・ベンチマーク・リリース日程はGA後に大幅に変更される可能性があります。「推計」「見込み」と明記した料金・ベンチマーク情報はGoogleの公式発表ではありません。最新情報はGoogle AI公式およびVertex AIドキュメントをご確認ください。