DeepSeek V4-Proの新しい料金はいくらですか？

2026年5月22日以降の永久価格は、キャッシュミス入力が$0.435/Mトークン、キャッシュヒット入力が$0.003625/M、出力が$0.87/Mです。GPT-5.5（入力$5/M、出力$30/M）と比べると入力11倍安、出力34倍安です。

なぜDeepSeekはこれほど安くできるのですか？

DeepSeek V4はハイブリッドアテンション機構（CSA+HCA）により、前世代比で推論時FLOPsが27%、KVキャッシュメモリが10%になりました。インフラコストが大幅に下がったため、収益を維持しながら価格を下げられます。

DeepSeek V4-Proをビジネスで使うリスクはありますか？

主なリスクはデータが中国国内サーバーに保存される点です。中国の国家情報法（2017年）により当局の要請に応じる義務があります。機密データを含む場合はオープンウェイトモデルを自社でホスティングすることで回避できます。

DeepSeek V4-Proの性能はGPT-5.5やClaudeと比べてどうですか？

SWE-bench Verifiedで80.6%（GPT-5.5は88.7%、Claude Opus 4.8は88.6%）。コーディングはGPT-5.5・Claude Opus 4.8の両方にやや劣ります。ただし出力トークンコストがGPT-5.5の34分の1のため、価格対性能比では群を抜いて高いです。

値下げは期間限定ですか？

いいえ。2026年5月31日に終了予定だったプロモーション割引を、5月22日に永久適用にすると発表しました。DeepSeekは架橋上の技術コスト削減が根拠であり、一時的な値引きではないとしています。

AI News 2026年5月30日 16分で読める

DeepSeek V4-Pro 75%永久値下げ｜GPT-5.5の34倍安いAIは使えるか

#DeepSeek #AI価格戦争 #APIコスト #DeepSeek V4-Pro #LLM比較 #中国AI

この記事はこんな人におすすめ

LLM APIのコスト削減を検討しているエンジニア・スタートアップ
DeepSeek V4-Proの性能と中国データ問題を天秤にかけたい開発者
AIモデルの価格競争が自分のプロジェクトにどう影響するか知りたい方

「出力トークンだけでChatGPTの34分の1。Claudeの29分の1。それで性能はSWE-bench 80.6%」。2026年5月22日、DeepSeekがフラッグシップモデルV4-ProのAPI価格を75%永久値下げすると発表したとき、開発者コミュニティは一瞬止まった。

出力トークン$0.87/M。この数字がどれほど異常かは、並べると伝わる。GPT-5.5は$30/M。Claude Opus 4.8は$25/M。Gemini 3.5 Flashですら$9/M。DeepSeekは「高性能モデルは高価で当然」という前提に揺さぶりをかけた。

ただ、「安すぎて怖い」という声も出ている。データが中国サーバーに送られる問題、APIの安定性、そして「なぜここまで安くできるのか」という根本的な疑問は消えていない。

価格の実態：GPT-5.5と並べると現実が見える

2026年5月22日以降の永久価格は以下の通りだ。

モデル	入力 $/1Mトークン	出力 $/1Mトークン	キャッシュ入力
DeepSeek V4-Pro	$0.435	$0.87	$0.003625
DeepSeek V4 Flash	$0.14	$0.28	—
Gemini 3.5 Flash	$1.50	$9.00	$0.15
Claude Opus 4.8	$5.00	$25.00	~$0.50
GPT-5.5	$5.00	$30.00	$1.25

（出典: DeepSeek API公式ドキュメント、OpenRouter、DevTk.AI、2026年5月30日時点。価格は変動する可能性があります）

※「34倍安い」はDeepSeek V4-Pro出力（$0.87/M）とGPT-5.5出力（$30/M）の比較。入力トークンの差は約11倍。

元の価格は入力$1.74/M、出力$3.48/Mだった。5月31日に終了予定だったプロモーション割引を、DeepSeekは9日前に「永久適用」に格上げした。

値下げの発表文には「プロモーション価格ではなく、V4アーキテクチャによるコスト削減の恒久的反映」と明記されている。要するにDeepSeekは「これが本来の価格だ」と言い切った。

キャッシュヒット価格の$0.003625/Mは特に目を引く。1,000万トークン（GPT-4レベルの中規模アプリが1日で消費する量）で$36.25。同じ量をClaude Opus 4.8でキャッシュ込みで使っても$5,000超になる場合がある。RAGやロングコンテキストを多用するアプリにとって、この差は無視できない。

なぜここまで安くできるのか：ハイブリッドアテンション機構

「価格競争ではなく技術的必然」というのがDeepSeekの立場だ。V4の中核にあるハイブリッドアテンション機構が、推論コストを根本から下げた。

V4のTransformerは2種類のアテンション手法を層をまたいで組み合わせている。

CSA（Compressed Sparse Attention）: トークンを比率mで圧縮してからトップkエントリにスパースアテンションを適用
HCA（Heavily Compressed Attention）: より強い圧縮比率でグループ化し、高密度アテンションをかける

この組み合わせにより、100万トークンのコンテキストを処理する際の推論FLOPsが前世代V3.2比で27%、KVキャッシュのメモリ使用量が**10%**にまで削減された（DeepSeek技術レポート、2026年4月）。

ざっくり言うと「同じ質問に答えるのに使うGPU計算が以前の4分の1以下になった」。インフラコストが下がれば、そのまま価格に転嫁できる。DeepSeekは「値引きして損をしているのではなく、技術的に安く作れるようになったから安く売っている」と主張している。

ただし、この技術主張が独立機関によって検証されたわけではない点には注意が必要だ。

性能は本物か：SWE-bench 80.6%の意味

「安い＝性能が劣る」という図式は成立しない。ベンチマークで確認する。

SWE-bench Verified（GitHubのissueを実際に解決する能力）:

GPT-5.5: 88.7%（1位）
Claude Opus 4.8: 88.6%（2位）
DeepSeek V4-Pro: 80.6%（3位）

V4-ProはGPT-5.5に約8ポイント差をつけられている。コーディング性能だけを見れば、V4-Proは両モデルに劣る。ただし出力コストの差（$0.87 vs $30）を考えると、問題は「どちらが強いか」ではなく「このコスト差を払ってまでフロンティアモデルが必要か」に変わる。

MMLU-Pro（多分野知識・推論）では、DeepSeek V4-ProとGPT-5.5が87.5で並び、Claude Opus 4.7の89.1に接近。競争力のある汎用推論性能を持つ。

Codeforces（競技プログラミング）では3206レーティングでV4-Proがリード。アルゴリズム的思考が問われる純粋なコーディング課題では上位を争う。

「コーディングの難しい部分」に関してはClaudeが依然として優位だ。長時間エージェントループ、複雑なリファクタリング、自己修正能力。これらはClaudeが2026年5月28日のOpus 4.8リリースでさらに磨いた領域だ。単純なコード補完タスクや短中規模の実装では、V4-Proで十分なケースが多い。

開発者コミュニティの本音

Hacker News（item #48237663, #48257410）での反応をまとめると、おおよそ3つの立場に分かれる。

「乗り換える」派: 「Deepseek V4 Pro is an amazing model, even without the unreal cost factored in」というコメントが複数のスレッドに現れた。O-HealthのAIスタートアップ共同創業者Akshar Keremaneは「価格・オープンソース・100万トークンのコンテキストウィンドウの組み合わせが、開発者・スタートアップ・中小企業にとっての参入障壁を下げた」と述べた（InfoWorld、The Next Web、2026年5月23日）。あるMLリサーチャーは自動コードレビュータスクのコストを$1,071から$268に削減したと報告している（Explainx.ai調べ）。

「様子見」派: APIの安定性を懸念するコメントが散見された。発表直後に429レート制限エラーが急増した（AndroidHeadlines、2026年5月）という報告がある。DeepSeek APIは過去のリリース直後に高負荷による遅延を繰り返しており、本番環境でのSLAが不明確な点を指摘する声が多かった。

「使わない」派（セキュリティ懸念）: 以前の割引発表時から「プロモーションが終わったら元の10倍安い水準に戻るだけだ」という懐疑論があったが（HN item #48052587）、今回の永久化で否定された。一方、フィンテックや医療系スタートアップの開発者からは「中国の法律下に置かれたデータをコンプライアンス上説明できない」という声も根強い。

InfoWorldの報道（2026年5月）によると、イタリアは以前のDeepSeekモデルをリリース後72時間以内に禁止。欧州データ保護委員会（EDPB）は専用タスクフォースを立ち上げ、韓国の個人情報保護委員会はDeepSeekがユーザープロンプトを北京のVolcano Engine Technology社に無断転送していたことを確認している。

DeepSeekは欧州規制当局に対して「EUの法律は自社サービスに適用されない」と回答したが、当局はこれを拒否した（IAPP、2026年5月）。

データリスクをどう回避するか

中国サーバーへのデータ転送問題には、現実的な回避策がある。

オープンウェイトでのセルフホスト: DeepSeekはモデルウェイトを公開しているため、AWSやGCP、オンプレ上で自社ホスティングが可能だ。この場合、データは自社インフラにとどまり、中国法律の適用範囲外になる。ただしインフラ費用と運用負担が発生する。

用途を限定する: 機密性の低いタスク（公開データのサマリー、汎用コード補完、英語翻訳など）に限定して使う方法。社内の会話ログ・個人情報・顧客データが含まれない場合は、リスクが格段に下がる。

APIゲートウェイで制御: OpenRouterやAWS Bedrock経由でDeepSeekモデルを呼び出すサービスが増えている。ただしこの場合も最終的なデータの流れを確認する必要がある。

GDPRや日本の個人情報保護法が絡む案件では、法務確認なしにV4-Proを本番環境に導入することは避けた方がよい。

DeepSeekのセキュリティ問題についての補足

2026年時点で明らかになっている主なリスク: (1) データは中国国内サーバーに保存、(2) 中国国家情報法（2017年第7条）により当局への協力義務あり、(3) 韓国PIBCがプロンプトの第三者無断転送を確認済み。セルフホストで大部分のリスクは解消可能。

AI価格戦争の構造：DeepSeekが変えたもの

DeepSeekの動きを「中国の安売り」と片付けると、本質を見誤る。

2025年1月のDeepSeek R1リリース以降、OpenAIとGoogleは相次いで価格を引き下げた。GPT-5.5の価格は同世代比で大幅に下がり、Gemini 3.5 Flashも競合水準で登場した。DeepSeekが起こした地殻変動は、「フロンティアモデルは高くて当然」という前提を崩したことだ。

スタンフォードAI Index 2026は「2024年比でGPT-4クラスの推論コストが97%以上削減された」と報告している。DeepSeek V4-ProはこのトレンドをAPIユーザーへ最も急速に届けたモデルの一つだ。

競合他社が追随するかは未知数だ。OpenAIとAnthropicはGPUインフラへの投資規模が大きく、価格競争に参入すれば利益率に直撃する。短期的には「DeepSeekを低コストのバックエンドに、ClaudeをフロントのエージェントAIに」というハイブリッド構成を取る開発者が増えるだろう。

AIコーディングエージェント比較でも触れたが、コスト最適化のルーターアーキテクチャ（簡単なタスクを安いモデルに流す設計）がスタンダードになりつつある。V4-Proの値下げはそのルーティング先として選ばれやすくなることを意味する。

DeepSeek V4と競合モデルの詳細比較は、DeepSeek V4完全解説記事も参照されたい。APIコストの計算にはAIコーディングエージェント比較が役立つ。

詳しく見る

関連記事

本記事の価格情報は2026年5月30日時点のものです。AIモデルの価格は頻繁に変更されます。最新情報はDeepSeek API公式ドキュメント（api-docs.deepseek.com）を確認してください。ベンチマーク数値は各社公表値または第三者評価機関の測定値に基づきますが、実際のユースケースでの性能は異なる場合があります。