OpenAI初の自社AIチップ「Jalapeño」全解説:推論コスト50%削減とNVIDIA依存脱却の現実
「外部の開発者には今日時点でなんの恩恵もない」。The New Stackは2026年6月24日の記事でOpenAI初の自社AIチップ「Jalapeño」をこう評した(出典)。OpenAIのエコシステム依存が深まるだけではないか、という懸念と共に。
一方でYahoo Financeは「NVIDIAへのストライク」と表現し(出典)、BenzingaはBroadcom株に注目して「JalapeñoはBroadcomの物語だ」と分析した(出典)。
発表当日、NVDAは0.26〜0.5%下落、AVGOは約2%上昇。この非対称な動きが今回の発表の構造を物語っている。
- OpenAIのAPIを業務で使う開発者・MLエンジニア
- AIインフラとNVIDIA依存問題に関心があるPM・技術リーダー
- Google TPU、AWS Trainium、Microsoft Maiaを含むカスタムAIチップ競争の全体像を把握したい方
9ヶ月で完成した「最速ASIC」の正体
JalapeñoはOpenAIがBroadcomと共同で設計し、TSMCが製造する推論専用ASICだ。「Project Nexus」という開発コード名のもと、2025年秋に設計着手から9ヶ月でテープアウトに至ったとされる。Broadcomはこれを「ハイパフォーマンス先端半導体における最速のASIC開発サイクル」と主張する(Tom’s Hardware)。
判明しているスペック:
| 項目 | 詳細 |
|---|---|
| 製造プロセス | TSMC 3nm |
| パッケージング | CoWoS(Chip on Wafer on Substrate) |
| メモリ | HBM3e × 8モジュール |
| ダイサイズ | リティクルサイズ(ウェーハ露光の最大面積) |
| アーキテクチャ | シストリックアレイ(LLM推論特化) |
| 用途 | 推論専用(学習非対応) |
| 開発期間 | 約9ヶ月 |
FLOPS・メモリ帯域幅・消費電力などの詳細スペックは非公開。OpenAIは「数ヶ月以内に詳細な技術レポートを公開する」と述べるにとどまった。
AIでチップを設計する:9ヶ月開発の裏側
OpenAIハードウェアプログラムリードのRichard Hoはプレスリリースでこう説明した。
「Jalapeñoは、OpenAI研究者との密接なコラボレーションから得た詳細な洞察を使い、LLM推論向けに一から設計した。フロンティアAIモデルにとって最も重要なカーネル、メモリムーブメント、ネットワーキング、サービングパターンを中心にアーキテクチャを最適化した」
9ヶ月という開発期間の背景には、OpenAI自身のAIモデルをチップ設計プロセスの加速に活用したことがある(VentureBeat)。EDAツールへのAI統合が進む中、これは自社モデルで設計サイクルを短縮した初の大規模事例の一つだ。
BroadcomはシリコンアーキテクチャとEthernet/InfiniBandネットワーキングを担当。シリコン設計の実績ではGoogle TPU、Meta MTIA、ByteDanceのカスタムチップを手がけてきた業界最大のXPUパートナーだ。製造はTSMCのN3(3nm)プロセスとCoWoS先進パッケージング技術を採用し、ダイ間の高密度接続を実現している。
「推論コスト50%削減」の主張を解剖する
Broadcom CEOのHock Tanがブルームバーグ他に語った数字が「現在のAI GPU対比で推論コスト約50%削減」だ。OpenAI公式声明は「現在の最先端技術を大幅に上回るパフォーマンス/ワット」という表現で同じ主張をより慎重に包んでいる。
この数字の問題は独立した検証が存在しないことだ。Tom’s Hardwareは「どのチップと比較したのか、どのタスクで、どのような条件下でテストしたのか不明」と指摘した。「現在のAI GPU」がBlackwell(H100/H200)なのかAmpere(A100)なのか、バッチサイズや精度設定次第でパフォーマンスは大きく変わる。
比較対象として参考になるのがAWS Trainium 2の事例だ。AWSはTrainium 2がH100/H200インスタンス対比で30〜40%のコスト改善を公式に主張しているが、MLPerfへの結果提出はなく、独立ベンチマークでは一致した数値が得られていない(Cerebrium比較)。Jalapeñoも同じ状況だ。
数ヶ月以内に公開予定とされる技術レポートが出るまで、50%という数字は経営的主張として参照する必要がある。
「全社カスタムチップ時代」:競合比較
2026年時点でGAFAM+OpenAIがすべて自社推論シリコンを持つ時代が来た。
| 企業 | チップ | パートナー | 主用途 | 状況 |
|---|---|---|---|---|
| TPU v5e/v6 | 自社設計・TSMC | 学習・推論 | 量産中 | |
| Amazon | Trainium 2/3 | 自社設計・TSMC | 学習・推論 | GA(2024年12月〜) |
| Microsoft | Maia 2 | 自社設計・TSMC | 推論 | Azure展開中 |
| Meta | MTIA v2 | 自社設計・TSMC | 推論 | 自社DC展開中 |
| OpenAI | Jalapeño | Broadcom設計・TSMC | 推論専用 | 2026末試験運用予定 |
| NVIDIA | Blackwell(B200/GB200) | 自社 | 学習・推論 | 量産中 |
構造的な差異が一点ある。Google TPUはPoD単位のカスタムネットワークを含む完全垂直統合だが、JalapeñoはMicrosoftのAzureデータセンター上で動作する予定で、ネットワーキングレイヤーの統合深度はまだ不明だ。
NVIDIAが依然として持つ優位は学習市場だ。CUDA上に4年以上蓄積された開発者エコシステム(NVIDIAが公表する登録開発者400万人超)は、ASICの価格優位だけでは一夜に崩せない。関連:NVIDIAのNIM・Nemotronエコシステム戦略
光と影:NVIDIA依存を断ち切る代償
光の面: OpenAIがJalapeñoで目指す最大の恩恵はインフラコストの構造的削減だ。2026年に約140億ドルの損失を計上する見込みのOpenAIにとって、推論コストを半分にできれば財務モデルが根本から変わる。IPO前に「利益率への道筋」を示す必要がある同社にとって、Jalapeñoは投資家向けのシグナルでもある(Axios)。なお「2026年に約140億ドルの損失」という数字はWSJ・Axios等複数メディアの報道に基づく。
影の面: 少なくとも3つのリスクが明確だ。
第一に資金調達の壁。The Informationが報じた通り、BroadcomはMicrosoftが生産量の約40%を購入契約することを条件にしており、この合意が得られなければ180億ドル規模のProject Nexus全体が止まる(The Decoder)。
第二にASICの硬直性。シストリックアレイ設計はLLM推論の定番行列演算には強いが、モデルアーキテクチャが次世代で変化した場合、チップを作り直す必要が生じる。GPUの汎用性とのトレードオフだ。
第三に外部開発者への恩恵がゼロという現実。The New Stackが指摘したように、APIエンドポイントには何も変わらず、Jalapeñoが動いているかどうかユーザー側から確認する手段もない。コスト削減がAPI価格に転嫁されるかどうかも保証なしだ。
デプロイタイムラインと今後の注目点
OpenAIとBroadcomが示したロードマップは段階的だ。
- 2026年末: OpenAI自社データセンターでの小規模プロトタイプ運用開始
- 2027年: Microsoftとの共同データセンター(1.3GW規模)への本格展開開始
- 2028年上半期: フル生産体制。Project Nexusの最終目標は10GW規模のデータセンター群
Broadcom CEO Hock Tanは「ギガワット規模データセンターへのデプロイをMicrosoftや他パートナーとともに2026年から始める」と明言した(Constellation Research)。
注目すべき次のイベントは2点。OpenAIが約束した「数ヶ月以内の技術レポート」と、MicrosoftによるProject Nexus向け購入契約の正式締結だ。前者が50%コスト削減の根拠を示し、後者が資金調達の壁を突破する鍵になる。
半導体・AIインフラの競争全体を俯瞰したい場合は、モジュラーAI推論の台頭も参照してほしい。関連:Qualcomm・Tenstorrent・NVIDIAのモジュラーAI推論競争
- 製造プロセス: TSMC 3nm(N3)
- パッケージング: CoWoS
- メモリ: HBM3e × 8モジュール
- アーキテクチャ: シストリックアレイ(推論専用)
- 設計: Broadcom(Project Nexus)
- 用途: LLM推論。学習用途は非対応
- 性能数値: 非公開(技術レポートは数ヶ月以内公開予定)
- 初期デプロイ: 2026年末、OpenAI自社DC限定
- フル生産: 2028年上半期
AIチップ競争の全体図を読む:Qualcomm・Tenstorrent・NVIDIAのモジュラー推論比較
関連記事
- Samsung・SK Hynix・AnthropicのHBM戦略:65B投資の真相
- AnthropicとOpenAIの収益競争:30億ドル vs 100億ドル、Broadcom連携の背景
- NVIDIAのNemotron Ultra:Computex 2026で示したエコシステム戦略
本記事の情報は2026年6月25日時点のものです。半導体・AIインフラの状況は急速に変化するため、最新情報は各社公式発表をご確認ください。Jalapeñoのスペック・性能数値は今後の技術レポート公開により更新される可能性があります。