DeepSeek V4完全事前解説|4月リリース予定とされる有力AI候補のスペック・価格・懸念点
「V4がオープンソースであれらのベンチマークを達成したら、米国のラボは終わりだ」。3月初旬、r/LocalLLaMAにそんな書き込みが流れた。
DeepSeek V4は業界で「2月リリース」「3月リリース」と予測されてきたが、いずれも外れた。DeepSeek社は一度もリリース日を公式発表していない。2026年3月30日現在、まだ公式発表はない。それでもAIコミュニティは沸いている。なぜか。
理由は単純だ。リーク情報が示す数字が、もし本物なら、コスト構造を根本から変えてしまう可能性があるからだ。PMとして複数のAIサービスを評価してきた立場から、確認済みの事実とリーク情報を分けて整理する。
- Claude APIやGPT-4o APIのコストを削減したいフリーランスエンジニア・PM
- DeepSeek V4のスペック・価格・リリース時期を把握したい開発者
- オープンウェイトLLMの次の選択肢を検討している個人開発者・AIサービス開発者
結論を先に言う。
- 今すぐ行動: DeepSeek V3.2(現行最新)をAPIで試す価値はある($0.28/100万トークン)
- V4待ちは合理的: 4月のリリースが確定したらコーディング・文書処理用途で真剣に検討する
- 業務利用はリスク管理必須: セキュリティ懸念と政府禁止の実績があり、機密データの投入は避ける
DeepSeek V4とは:V3からの経緯
DeepSeekは中国・杭州のAI企業DeepSeek(深度求索)が開発するLLMシリーズだ。2024年12月に公開されたDeepSeek-V3が「GPT-4o同等の性能をはるかに低コストで実現した」として世界のAIコミュニティに衝撃を与え、その後DeepSeek-R1(推論特化)、V3-0324、V3.1、V3.2と改良が続いている。
V4は現在も学習・最終調整段階にあるとみられ、公式の技術レポートもAPIエンドポイントもまだ存在しない。ただし、DeepSeekに在籍する研究者が共著した論文(arxiv 2601.07372)や、信頼性にばらつきがある複数のリーク情報から、一定の輪郭は見えてきた。
このリーク情報を扱ったメディアの質にも注意が必要だ。「DeepSeek V4」をタイトルに入れたSEO狙いの低品質記事が大量発生しており、数値の信頼性には幅がある。以下では情報源のグレードを示しながら整理する。
リーク情報から見えるスペック(未確認)
公式発表は存在しない。以下はすべて「リーク・推測情報」として読んでほしい。
| 項目 | リーク情報 | 確認度 |
|---|---|---|
| 総パラメータ数 | 約1兆 | 低(複数サイトが同値を引用) |
| アクティブパラメータ | 約32B(MoE構成) | 低 |
| コンテキストウィンドウ | 100万トークン | 低 |
| マルチモーダル | テキスト・画像・動画 | 低 |
| アーキテクチャ革新 | Engram Memory Architecture | 中(論文は実在) |
| 推論速度 | V3比1.8倍高速 | 低 |
MoEとは「全パラメータを毎回使わず、必要なエキスパートだけ起動する」設計だ。1兆パラメータのモデルでも推論時に動くのは32B相当で、コストと速度をコンパクトに抑えられる。これはMeta Llama 4と同じ設計思想だ(Llama 4の仕組みは「Meta Llama 4完全解説」で詳しく解説している)。
arxiv論文「Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models」(2601.07372、2026年1月)はDeepSeekの研究者が共著した実在の論文だ。O(1)のメモリ検索を実現し、27Bスケールの実験でMMUL +3.4、MATH +2.4、HumanEval +3.0の改善を示した。ただしこれがV4に実装されるかは未確認で、DeepSeekは公式に言及していない。
「Hunter Alpha」事件:誤報が生まれた背景
3月中旬、OpenRouterに「Hunter Alpha」という謎のモデルが登場し、AIコミュニティが「DeepSeek V4では?」と騒いだ。ベンチマーク数値がリーク情報と合致していたためだ。
調査した複数のエンジニアが「チェーン・オブ・ソートのパターンがDeepSeekに似ている」と指摘。Technology.orgのDaniel Dewhurst記者が「推論スタイルは偽装が難しく、学習方法が滲み出る」と述べた。
結論:Hunter AlphaはXiaomi(小米)のMiMo-V2-Proのステルスローンチ版だった。正式公開前に匿名でデプロイされていたものだ。
この事件が示すのは、AIコミュニティのDeepSeek V4への期待値の高さだ。同時に「リーク情報はいかに確認が難しいか」も示している。DeepSeek V4に関する情報を読むときは、Hunter Alphaの誤報を常に念頭に置く必要がある。
ベンチマーク数値:信じるべきか
第三者サイトが報告するDeepSeek V4の数値はこうだ。
| ベンチマーク | DeepSeek V4(自称) | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| SWE-bench Verified | 83.7% ※ | 約80% | 80.6% |
| HumanEval | 98% ※ | 参考値 | 参考値 |
| GSM8K | 96% ※ | 参考値 | 参考値 |
※ これらはすべて非公式のリーク値または第三者サイトの引用。独立した第三者検証は一切存在しない。
正直に言う。DeepSeek-V3.2(現行最新の公式モデル)の検証済みスペックと比較してほしい。
| ベンチマーク | DeepSeek-V3.2(公式確認済み) |
|---|---|
| MMLU-Pro | 85.0 |
| GPQA Diamond | 82.4 |
| AIME 2025 | 93.1 |
| LiveCodeBench | 83.3 |
V3.2でもコーディング性能は高い。V4がそこからどれだけ向上するかは、実際にリリースされるまでわからない。
AIベンチマークの読み方については「Humanity’s Last Exam:AIは本当に人間を超えたのか」も参照してほしい。数値の見え方は操作できる。
また、Meta Llama 4のLMArena疑惑(評価版と公開版を別ものにして高評価を得た件)のように、自社申告のベンチマークには注意が必要だ(詳細は「Meta Llama 4完全解説」参照)。
価格:これだけは期待していい
価格については、DeepSeek V3系の実績から推測できる部分がある。
現行のDeepSeek-V3.2の公式API価格は、入力$0.28/100万トークン、出力$0.42/100万トークン(DeepSeek公式APIドキュメント、2026年3月時点)だ。
リーク情報によるV4の予測価格($0.28〜0.30/100万トークン入力)はV3.2とほぼ同水準で、DeepSeekの低価格戦略が継続するとみられている。
比較として:
- Claude Sonnet 4.6:$3.00/100万トークン(入力)
- GPT-5.4 Thinking:公開価格未発表
- Gemini 3.1 Pro:$2.00/100万トークン(200K以下)
- DeepSeek-V3.2(現行):$0.28/100万トークン(入力)、$0.42/100万トークン(出力)
単純な価格比較では圧倒的だ。「コスト重視の大量バッチ処理」に使う前提なら、V4のリリースを待つ理由は十分ある。
セキュリティと安全性:無視できない懸念点
DeepSeekをめぐる問題は価格と性能だけではない。
有害コンテンツのフィルタリング:CiscoとRobust Intelligenceが行ったHarmBenchを用いた評価(ペンシルベニア大学との共同研究)によると、DeepSeek-R1は有害プロンプトへのジェイルブレイク成功率がほぼ100%だった。GPT-4oの86%、Gemini系の64%と比べて著しく高い(ブロック率が著しく低い)。R1とV3.2では設計が異なるが、同系統のモデルとして業務利用での倫理リスクは注視すべきだ。
データ流出事故:2025年にClickHouseデータベースの設定ミスにより、チャット履歴・APIシークレット・ユーザーメールアドレスが外部からアクセス可能な状態になっていたことが報告された(Wiz Researchが発見)。
各国政府の禁止措置:イタリア・台湾・オーストラリア・韓国が政府端末へのDeepSeek使用を禁止している。理由はデータが中国サーバーに保存されること、およびCCPとの潜在的な関係への懸念だ。
Anthropicとの関係:DeepSeekはAnthropicから蒸留攻撃を受けたとして告訴されている企業の一つだ(詳細は「AI蒸留攻撃とは:DeepSeekらが2.4万偽アカウントでClaude能力を抽出か」)。この事実はDeepSeekの技術力の評価に直接影響しないが、信頼性の一側面として知っておく価値がある。
業務で使う場合、機密情報・個人情報・クライアントの非公開データをDeepSeekに入力することは現時点でリスクが高い。これはV4でも同様の判断になる可能性が高い。
PMとしての評価:今どう動くか
率直に言う。
DeepSeek V4が予告通りのスペックでリリースされれば、コスト重視の非機密タスクでは真剣な選択肢になる。「Claude Codeに全部任せる」から「非機密の文書要約・分類・コード補助にDeepSeekを使い、コア作業はClaudeで」という使い分けが現実的になる。
ただし、現時点でやるべきことは一つだ。まずDeepSeek-V3.2のAPIを自分のユースケースで実際に試すこと。
V4のリーク情報を信じて今から計画を立て直す必要はない。V4がリリースされたとき、V3.2での評価経験があれば改善点をすぐに判断できる。
PMとして私が注目しているのはベンチマーク数値ではなく、日本語タスクの品質と長いプロジェクトでのコンテキスト安定性だ。この2点については、実際にリリースされてから検証する。
DeepSeek V3.2 APIは今すぐ試せる。DeepSeek Platformで無料クレジットから始められる。V4リリース前の比較基準を作っておくと、判断が速くなる。
V4のリリースを追跡する方法
公式情報は以下から確認できる:
- DeepSeek公式ブログ:deepseek.com
- APIドキュメント変更履歴:api-docs.deepseek.com/updates
- GitHub(DeepSeek-AI):github.com/deepseek-ai
r/LocalLLaMAとHacker Newsがリリース速報の情報源として機能している。ただし上述のHunter Alpha事件のように、誤情報も多い。公式APIドキュメントに新モデルが追加されたことを確認してから動くのが確実だ。
関連記事
- AI蒸留攻撃とは:DeepSeekらが2.4万偽アカウントでClaude能力を抽出か
- Meta Llama 4完全解説:10Mトークン・MoE革新と開発者が語る光と影
- Gemini 3.1 Pro完全解説:ベンチマーク王者が抱える光と影
- Humanity’s Last Exam:AIは本当に人間を超えたのか
本記事の情報は2026年3月30日時点のものです。DeepSeek V4はこの時点で公式未リリースであり、スペック・価格・リリース日は変更される可能性があります。投資判断や重要な業務意思決定には公式発表をご確認ください。
DeepSeek、Claude、Gemini、GPT-5.4はそれぞれDeepSeek、Anthropic、Google、OpenAIの商標です。