メインコンテンツへスキップ
AI News 17分で読める

Claude Sonnet 5完全解説 — エージェント特化の中間モデルと3つの破壊的変更

「temperature=0.7を設定していたAPIが全部400エラーになった。リリースノートをちゃんと読め、という話だが、さすがに事前告知が短すぎる」。2026年6月30日夜、Hacker Newsのスレッド(HN: Introducing Claude Sonnet 5)にはこんな声が飛び交っていた。

同日朝、AnthropicはClaude Sonnet 5を正式リリースした(Anthropic, 2026年6月30日)。SWE-bench Verifiedで72.7%、Terminal-bench 2.1で76.1%と、Sonnet 4.6(62.3%、55.4%)を大幅に上回る数値を出しながら、価格はイントロ期間中ならOpus 4.8の7分の1以下に抑えた。「エージェントを安く動かす」という一点に絞ったモデルだ。

だが同時に3つの破壊的変更が走っており、既存の実装を持つ開発者には即日の対応が求められた。本記事ではスペックの読み方から移行チェックリストまで、使う側の視点で整理する。

この記事はこんな人におすすめ
  • Claude CodeやAgent SDKでSonnet 4.6を使っており、Sonnet 5への移行コストを評価したい開発者
  • APIでtemperature・top_pを設定しており、400エラーの原因と対処法を知りたいエンジニア
  • 新モデルのベンチマーク数値の意味とコストパフォーマンスを判断したいPM・テックリード

Claude Sonnet 5の全貌 — 2026年6月30日に何が変わったか

Claude Sonnet 5は「エージェントを安く動かすための中間モデル」として設計された。従来、複雑な自律タスクにはOpus 4.8が必要だったが、その7分の1以下の価格で近い性能を引き出すというのが開発コンセプトだ。

主要スペックは次のとおり(Anthropic公式, 2026年6月30日)。

項目Claude Sonnet 5Claude Sonnet 4.6Claude Opus 4.8
イントロ価格(〜8/31)入力$2/出力$10 /1Mトークン
標準価格入力$3/出力$15入力$3/出力$15入力$15/出力$75
コンテキスト窓100万トークン100万トークン20万トークン
最大出力12万8000トークン6万4000トークン6万4000トークン
SWE-bench Verified72.7%62.3%79.4%
Terminal-bench 2.176.1%55.4%
OSWorld(コンピュータ操作)81.2%78.5%

Sonnet 4.6もすでに1Mトークンのコンテキスト窓を備えている。Sonnet 5との主な差は最大出力トークン数(64K→128K)と、Adaptive Thinking常時ONによるエージェント動作の安定性だ。長いタスクチェーンで途中出力が切れにくくなる点は実運用上で効いてくる。

なお、Sonnet 5はFreeプランとProプランのデフォルトモデルとして設定された。既存のProユーザーが何もしなくても自動切り替えが起きる点は、使い慣れたモデルへの依存度が高いユーザーにとって留意すべき変更だ。

ベンチマーク比較 — 数値は何を意味するか

SWE-bench Verifiedは実際のGitHubイシューを解決させるコーディングテストで、合成問題ではなく実プロジェクトの修正課題が対象となる。Sonnet 5の72.7%はSonnet 4.6比で10.4ポイントの改善だ(MarkTechPost, 2026年6月30日)。

Terminal-bench 2.1の改善幅はさらに大きい。76.1%はSonnet 4.6の55.4%に対して20.7ポイント上回る。ターミナル操作・シェルスクリプトの自律実行能力がSonnetシリーズの中では別格の水準になった。

ただし数値を読む際の注意点が一つある。Lenny’s Newsletterが実施した64回生成の比較テスト(Lenny’s Newsletter, 2026年6月)では、PRD品質やアイデア生成の盲目評価でSonnet 5がSonnet 4.6を上回ったが、コードレビュー用途ではCodeRabbitが「バグ検出率はSonnet 4.6以下」という逆の結果を示している(CodeRabbit, 2026年6月)。「エージェント特化」とはすなわち、自律的なタスク完遂能力に最適化されており、人間が逐一レビューする用途では従来モデルが上回るケースもあることを示している。

競合であるGPT-5.6(OpenAI, 2026年6月26日プレビュー)と比べると、Sonnet 5の最大の優位点は可用性だ。GPT-5.6は約20社の承認済みパートナーに限定されたアクセスで展開されているのに対し、Sonnet 5はリリース当日からAPIを含む全プランで利用可能だった(DataCamp, 2026年)。価格帯でもSonnet 5のイントロ$2/$10に対しGPT-5.6 Terra相当モデルは$2.50/$15と同水準かやや高い。

3つの破壊的変更と移行チェックリスト

Sonnet 5には後方互換性を持たない変更が3つある。既存のコードを流用する場合は事前確認が必須だ(Anthropic DocsChatForest, 2026年6月30日)。

破壊的変更1: サンプリングパラメータの廃止

temperaturetop_ptop_kをデフォルト以外の値に設定すると400エラーが返る。例えばtemperature=0.7というよくある設定が即エラーになる。これが冒頭で紹介したHacker Newsの混乱の原因だ。モデルがAdaptive Thinking(適応的思考)を内部で管理するようになったため、外部からのサンプリング制御が廃止されたという設計判断だ。

移行対応: APIコールからこれらのパラメータを削除する。Sonnet 5はAdaptive Thinkingを自動で調整するため、ほとんどのケースで精度への影響は軽微とされる。

破壊的変更2: 手動Extended Thinkingの廃止

Sonnet 4.6でdeprecatedになった手動Extended Thinking(thinking: {type: "enabled"})が、Sonnet 5では400エラーになる。Adaptive Thinking(Anthropicが管理する自動思考)に完全移行した。

破壊的変更3: Adaptive Thinkingがデフォルトで有効

Adaptive Thinkingはオフにできない。シンプルなリクエストにも思考プロセスが走るため、低レイテンシを要求するリアルタイムアプリケーションでは注意が必要だ。一方で、これがエージェント精度の向上に寄与している。

新トークナイザーの隠れたコスト計算

Sonnet 5は新しいトークナイザーを採用しており、同じテキストでも従来比約30%多くトークンを消費する。Anthropicはこの増加を見込んでイントロ価格($2/$10)を設定しており、Sonnet 4.6($3/$15)からの移行は概ねコスト中立になるよう設計された(ChatForest, 2026年6月)。

問題は2026年9月1日の標準価格移行後だ。$3/$15に戻った時点でトークン増加分が純粋なコスト増になる。

試算例: Sonnet 4.6で月$1000のAPIコストがあった場合、Sonnet 5標準価格では同じテキスト量で$1000 × 1.30 = $1300(30%増)になりうる。実際にはプロンプトキャッシュ(最大90%割引)やバッチ処理(50%割引)で相殺できるが、これらを使わない実装では注意が必要だ。

またmax_tokensをSonnet 4.6に合わせてチューニングしていた場合、Sonnet 5では出力が途中で切れる可能性がある。1Mトークンのコンテキスト窓も、旧トークナイザー換算で約77万トークン分の内容に相当する点も理解しておきたい。

エージェント開発への実用的影響

早期アクセスパートナーからの評価はおおむね好意的だ。「以前のSonnetモデルが途中で止まっていたような複雑なタスクを最後まで完遂する」「明示的に頼まなくても自分のアウトプットをチェックする」という声が複数寄せられている(Anthropic公式より)。

Claude Code(Anthropicのターミナルエージェント)ではSonnet 5が推奨モデルとして設定される見込みで、Agent SDKを使ったエージェント構築においても「エントリーとしてSonnet 5、高難度タスクにOpus 4.8」という分担が有力になる。1Mトークンの巨大コンテキストは、大規模コードベースの一括解析や長時間セッションのエージェントループに直接恩恵をもたらす。

一方で制約もある。SimonWillison.netの分析によると、サイバーセキュリティタスクではMythos 5よりも大幅に低い性能で、セキュリティ研究用途には向かない(Simon Willison, 2026年6月30日)。また安全性評価では悪意あるリクエストの拒否率が上がっており、プロンプトの書き方次第で以前は通っていたリクエストが弾かれるケースが出うる。

Claude Sonnet 5 主要スペック(2026年6月30日時点)
  • リリース日: 2026年6月30日
  • デフォルトプラン: Free・Pro(自動切り替え済み)
  • イントロ価格(〜2026年8月31日): 入力$2/出力$10(100万トークンあたり)
  • 標準価格(2026年9月1日〜): 入力$3/出力$15
  • コンテキスト窓: 100万トークン(旧モデルの5倍)
  • 最大出力: 12万8000トークン(旧モデルの2倍)
  • SWE-bench Verified: 72.7%(Sonnet 4.6比+10.4pt)
  • Terminal-bench 2.1: 76.1%(Sonnet 4.6比+20.7pt)
  • トークナイザー: 従来比+30%(移行時の注意点)
  • 廃止パラメータ: temperature、top_p、top_k(400エラー)
  • Adaptive Thinking: デフォルトON(無効化不可)

関連記事

Sonnet 5への移行コストを事前に試算したい開発者へ

新トークナイザーの30%増加は現在のAPIコストに直接影響します。プロンプトキャッシュとバッチ処理の組み合わせで実コストを最適化する方法はClaude Agent SDK完全ガイドで解説しています。

Claude Agent SDK完全ガイドを見る

免責事項: 本記事の価格・スペック・ベンチマーク数値はAnthropicの公式発表および複数の技術メディアの報道に基づいています。価格はAnthropicの判断により予告なく変更される場合があります。ベンチマーク数値は特定のテスト条件下での結果であり、実際の用途での性能を保証するものではありません。APIの仕様変更(破壊的変更を含む)については必ずAnthropicの公式ドキュメントを確認してください。記事の内容は2026年7月1日時点の公開情報に基づいています。

Share