「Claudeが劣化した」は本当か|Anthropicが認めたeffort削減の実態と今後
「Claude Codeが退行して、複雑なエンジニアリング作業に使えなくなった。」
AMDのAIグループでシニアディレクターを務めるStella Laurenzoは、2026年4月2日にGitHub上のClaude Codeリポジトリへ開いたissueにそう書いた(出典:The Register、2026年4月6日)。彼女はただ怒鳴り込んだわけではない。6,852件のClaude Codeセッション、17,871個のthinkingブロック、23万4,760回のツール呼び出しを自力で分析し、2月以降でモデルの推論深度が67%低下したというデータを添えていた。
この投稿はXでバイラル化し、GitHubのissueは1,060件以上のupvoteを集めた(出典:Trend Reader、2026年4月7日)。開発者コミュニティで「Claudeがネーフされた」という言葉が飛び交いはじめ、Fortuneは4月14日付けで「Anthropic faces user backlash(ユーザーの反発に直面)」と報じた(出典:Fortune、2026年4月14日)。
何が起きているのか。事実とAnthropicの言い分を整理する。
- Claude Codeを業務で使っているエンジニア・フリーランス
- Claude Proまたは Max プランの課金を検討中の方
- 「最近Claudeの応答が変わった気がする」と感じている方
- Anthropicの経営判断の背景を理解したい方
Anthropicが認めた3つの変更
ユーザーの怒りを受け、Claude Code担当のBoris Cherny(Anthropic)は公式に変更内容を認めた(出典:VentureBeat、2026年4月)。
変更①:2026年2月9日 / adaptive thinkingの導入
Opus 4.6にadaptive thinkingが導入された。モデルが問題の複雑さに応じて思考深度を動的に調整する仕組みで、シンプルなタスクには深い推論を使わない設計だ。
変更②:2026年3月3日 / デフォルトeffortを「medium」に引き下げ
これが最大の争点だ。Claude Opus 4.6のデフォルトeffortレベルが「high」から「medium」(レベル85)に変更された。Chernyはユーザーの声を根拠にした変更だと説明した。「大半のユーザーにとって、知能・レイテンシ・コストの最良のバランスがmediumだ」という。
変更③:2026年3月12日ごろ / thinkingコンテンツの非表示化
UIから思考プロセスの表示が消えた。ヘッダー「redact-thinking-2026-02-12」による変更で、Chernyは「UIの変更であり、thinking自体には影響しない」と主張している。
| 日付 | 変更内容 | Anthropicの説明 |
|---|---|---|
| 2/9 | adaptive thinking導入 | 問題の複雑さに応じた動的調整 |
| 3/3 | defaultをhigh→medium(レベル85) | コスト・レイテンシ・品質のバランス最適化 |
| 3/12 | thinking表示を非表示化 | UI変更のみ、thinking自体は不変 |
データが示す67%の低下
Laurenzoの分析はAnthropicの説明に直接反論する形になっている。
彼女が測定したのは、2月前と3月3日の変更後の推論ブロック数の比較だ。Claude Codeセッションのthinkingブロックを追跡した結果、2月後半までに推論深度は約67%低下していた。思考プロセスがUIで見えなくなった後も、実際の推論自体が減っていたとする分析だ。
さらに深刻な指標として、「stop-hook violations」の増加がある。これはClaude Codeが手を抜いたときに発火するチェック機構だ。2月中旬まではゼロだったが、3月以降は1日平均10件にまで増加した(出典:The Register、2026年4月13日)。
VentureBeatが伝えるユーザーの声はこうだ。「コード編集が以前は一発で決まっていたのに、今は何度も試みる必要がある。違うファイルを編集したり、既存コードを無視したり、重複を生成したりする」(出典:VentureBeat)。
一方で反論もある。外部評価機関のMargin Labは、SWE-Bench-Proのスコアで2月以降に「大きな変化はない」とする測定を公開している。Anthropicが主張する「モデルの品質自体は変わっていない」という立場と整合する。
光:Anthropicの主張
Anthropicは公式に次のように声明を出した。「We never reduce model quality due to demand, time of day, or server load.(需要・時間帯・サーバー負荷によって品質を下げることは一切ない)」
Boris ChernyはXで、effort引き下げが意図的なプロダクト判断であることを認めながら、「ネーフィングではなく最適化だ」と説明した。実際、APIユーザーはパラメータeffort: 'high'を明示的に指定することで、以前の挙動に近いアウトプットを得ることができる。設定の余地が残されている点は、完全な後退ではない。
影:ユーザーが感じる裏切り
問題は技術的な事実よりも、変更の透明性にある。
3月3日にeffortのデフォルトが変わったとき、Anthropicはユーザーへの事前告知を行わなかった。月100〜200ドルを払っているMax Planユーザーが気づいたのは、自分のワークフローが壊れてからだ。
「バグなのか仕様なのかも分からなかった。こちらが何かミスをしたのかと3日間悩んだ」というエンジニアの声が複数のフォーラムに並んでいる(出典:TokenCost.app分析、2026年4月)。
Hacker Newsに立ったスレッド「Has Claude Code quality gotten worse?」にも同様の不満が殺到した(出典:Hacker News)。「以前なら正確に編集できていた関数が、今は全く違うファイルを書き換えている」「タスクを渡すたびに手法が変わる。一貫性がなくなった」という具体的な指摘が上位を占め、「Claudeを信頼して使ってきた理由が消えた」というコメントが多数のupvoteを獲得した。
Anthropic最大の顧客は開発者だ。Claude Codeのヘビーユーザーこそが、企業にAnthropicを提案する口コミの起点だった。その層が「信頼できなくなった」と感じ始めていることは、長期的なダメージになり得る。
なぜ今、effortを削ったのか
背景にあるのは単純な需要と供給の問題だ。
2026年2月末のOpenAI騒動以降、Claudeへの移行が加速した。#QuitGPT運動でChatGPTアンインストールが295%急増し、ClaudeはApp Store 1位を獲得。2月から3月にかけて日次ユーザー数が2倍以上に増加し、年間収益は$30B ARRに到達した(出典:The AI Corner)。
成長は急速すぎた。Anthropicは3月だけで5回のサービス障害を経験した(出典:The New Stack)。GPUキャパシティがユーザー増加のペースに追いつかず、effortのデフォルト引き下げはコスト効率化の緊急措置だった可能性が高い。
この数字を整理すると規模感がわかる。Claude Codeは発売後6ヶ月で$1B ARRを達成し、年間$100万超を使う企業顧客は4月時点で1,000社を超えた(出典:Fortune)。Googleが$6B、Amazonが$4Bを出資しても、インフラ拡張がユーザー増加のペースに追いつけないのは珍しいことではない。OpenAIも同じ問題を経験している。ただ、競合他社との違いは「変更を黙って実施した」点にある。
Anthropicはその後、対策を講じている。4月10日、データセンター容量をCoreWeaveから調達する多年・数十億ドル規模の契約を締結した(出典:Bloomberg、2026年4月10日)。CoreWeaveのCEOによれば、この契約によりCoreWeaveのバックログは**$66.8B(約668億ドル)**を超えた(出典:Yahoo Finance、2026年4月10日)。新キャパシティは2026年後半から段階的に稼働予定だ。
Claude Proプランを試す
月$20のClaude Proプランでは、SonnetモデルへのアクセスとAPI優先度が上がる。effortパラメータはAPIプランで制御可能。
開発者が今できること
①APIユーザー:effortを明示指定する
APIを直接呼び出している場合、effort: 'high'を明示することでデフォルトの引き下げを回避できる。トークン消費量は増加するが、品質は3月以前に近づく。
{
"model": "claude-opus-4-6-20250514",
"thinking": {
"type": "enabled",
"budget_tokens": 10000
},
"effort": "high"
}
②claude.aiユーザー:タスクを具体的に指定する
UIから直接effortを変更する手段はないが、プロンプトで「ステップバイステップで徹底的に考えてください」と明示することで、adaptive thinkingを高effortに誘導できる場合がある。ただしこれは確実な方法ではない。
③Claude Codeユーザー:/model sonnetでコストを最適化する
複雑なタスクにはOpus、単純作業にはSonnetと使い分けることで、effortの引き下げ影響を受けにくくなる。/model claude-sonnet-4-6コマンドで切り替えられる。
今後の見通し
Claude Codeが6ヶ月で$1B ARRを突破し、企業顧客1,000社以上が年間$100万超を支出する現状では、Anthropicにとって開発者の信頼は死活問題だ(出典:Anthropic報告、2026年4月)。
CoreWeaveとのインフラ契約が2026年後半に稼働すれば、キャパシティ問題は緩和される。その時点でeffortのデフォルトが再調整されるかどうかは、Anthropicが今回の騒動から何を学ぶかにかかっている。
今言えるのは、「Claudeが劣化した」という感覚は少なくとも一部のユーザーにとって事実であり、Anthropicも変更を認めているということだ。完全な「ネーフィング」でも完全な陰謀論でもなく、需要急増に対応する中で起きた設定変更と透明性の欠如が重なった問題だ。
関連記事
- Claude使用制限が突然キツくなった理由|ピーク時間帯の仕組みと7つの対策 — 同時期に起きたレート制限強化の詳細
- Claude Sonnet 4.6レビュー|SWE-bench 79.6%でOpus級性能をSonnet価格で — effortの影響を受けにくいSonnet 4.6の性能評価
- Anthropic完全ガイド|Claude生みの親の全貌 — Anthropicの経営思想とConstitutional AIの背景
免責事項:本記事の情報は2026年4月14日時点のものです。Anthropicの製品仕様、価格、ポリシーは予告なく変更される場合があります。最新情報はAnthropic公式サイトおよび公式リリースノートをご確認ください。