Claude Code Maxに切り替えるべきか|xhigh時代のフリーランス損得勘定
- Claude Code Proプラン($20)を契約中で、Maxプラン($100/$200)へのアップグレードを検討しているフリーランス・個人開発者
- Auto Modeを試したいが、Team加入の正当化が難しかったMaxユーザー
- xhighエフォートとAuto Modeのコスト感・リスクを把握してから判断したい方
「auto modeを信用していたのが信用できなくなって」。Zennで4月27日に公開されたyotta氏の検証記事で報告された事例は、Maxプランで解禁されたばかりのAuto Modeに乗り換えようとしている人にとって不穏な内容だ。cargo publishの直前で偶発的に止まった承認スキップ、自分で書いたorchestrator.mdのガバナンスルールを違反するモデル挙動など、Opus 4.7の自走環境で起きた事象が並ぶ。月額100ドル、20xなら200ドルを払う側の心構えが問われる報告だ。
2026年4月16日にリリースされたClaude Code v2.1.111は、フリーランスのコスト構造を一気に動かすアップデートだった(公式CHANGELOG)。Opus 4.7のxhighエフォート、これまでTeamプラン限定だったAuto ModeのMaxプラン解禁、そして--enable-auto-modeフラグの廃止。3月発表時点でAuto Modeを使うにはTeam契約が必要だった構図が、Max 5x(100ドル/月)から手が届くようになった。
問題は、その差額の80ドルに見合うかという話である。
v2.1.111で何が変わったか:3点だけ整理する
公式リリースノートから、Maxサブスクライバーに直接効く変更点は3つだ。
1. Opus 4.7のxhighエフォートが追加
highとmaxの中間に位置する新エフォートレベルで、Opus 4.7専用。他モデルではコマンドを叩いてもhighにフォールバックする。Anthropicは公式ドキュメントで「Long-running agentic and coding tasks (over 30 minutes) with token budgets in the millions」向けと位置づけ、コーディング・エージェント業務の標準的な出発点として推奨している(Effort公式ガイド)。
ベンチマーク数値はOpus 4.7全体のものを参照する。SWE-bench Verifiedで87.6%、Terminal-Bench 2.0で69.4%、GPQA Diamondで94.2%が公式系ソースで報告されている(Vellumの解説まとめ)。他方、MRCR v2のロングコンテキスト性能は256kで59.2%、1Mで32.2%と4.6から後退しており(Wentuo AI調査)、Anthropicも同ベンチマークから別評価軸への移行を示唆している。xhigh単体のベンチスコアとして流通している数字は出典が曖昧なものが混じっているため、コーディング系のSWE-bench / Terminal-Benchを信頼しつつ、ロングコンテキスト依存の作業ではプロンプト分割を併用する運用が無難だ。
2. /effortコマンドのインタラクティブ化
引数なしで/effortを打つと、矢印キーでlow / medium / high / xhigh / maxを切り替えるスライダーが開く。/effort autoでモデルデフォルトに戻せる。/modelピッカー内でも左右矢印キーでエフォートを直接いじれるようになった。Classmethodの西村祐二氏が4月19日に書いた評価が地味に的を射ている。「カーソル移動だけで済む」「軽い質問では/effort mediumに落としてからやり取りする使い分けもあり」。xhighが事実上のデフォルトになった結果、トークン消費が体感1.0〜1.35倍に膨らんだという声も出ている(coa00氏の運用記録、4月22日)。
3. Auto ModeがMaxプランに解禁、--enable-auto-modeフラグは廃止
Auto Modeは、ツール呼び出しのたびにSonnet 4.6ベースの分類器が危険な操作を検査し、安全と判断したものだけ自動承認する仕組み。3月24日のリサーチプレビューではTeamプランのみ、4月16日でMaxプランに範囲拡大された(Opus 4.7限定)。--enable-auto-modeフラグはv2.1.111で廃止され、ヘルプ出力からも消えた。シェルのエイリアスに残っている人は、起動コマンドから外しておく方がよい。
xhigh実測:Maxプラン勢が知っておくべき数字
xhighがmaxより約9%安く、ほぼ同等の品質に届く。これがv2.1.111直後に最も広く共有された実測結果だ。Qiitaに4月17日に公開されたnogataka氏の検証では、Next.jsのバグ修正・新機能実装・600行規模のReactリファクタの3タスクを5つのエフォートレベルで走らせている。要点だけ拾うと、
- 600行リファクタは
xhighのみが「責務分離まで含めて完走」、highは△、low/mediumは失敗 xhighはmax比で処理時間とthinkingトークンを約40%削減- 軽量タスクではmediumから開始し、品質不足ならエスカレーションする運用が現実的
PURPM MEDIA LABのcoa00氏は実運用記録として「effort使い分けでAIコスト15〜30%削減」を報告する一方で、temperature/top_pを指定すると400エラーになる仕様変更や、Claude Codeセッション内でxhighをリアルタイムに動的制御できない点を不満に挙げる。トークナイザー側の倍率変動として「1.0〜1.35倍」も同記事で言及されており、Maxプラン側では使用上限が事実上の天井になるため、この消費増は無視できる範囲ではない。
Hacker NewsのOpus 4.7発表スレッドでも評価は割れている。同スレッド内のarcanemachiner氏は「200Kトークン超のロングセッションでも品質低下を感じなかった」と肯定的な体感を残す一方、JamesSwift氏は「adaptive thinkingが強制ONで切れない仕様で、指定してもthinking量が状況依存で変動するためコスト予測が難しい」と否定的な反応を見せる。xhighの手応えは、扱うタスクの種類とロングセッションの頻度で評価が分かれている、というのが現時点での読みだ。
Auto Mode for Maxの光と影
光の側面から見ると、Auto Modeの設計は3月のTeam解禁時から評価されている。--dangerously-skip-permissionsのような全許可スイッチではなく、Sonnet 4.6が個別に判定する点でリスクは大幅に下がる。1日に何十回と発生する承認プロンプト疲労から解放されるメリットは、フリーランスにとって小さくない。Zennのsoushu氏は同時期に追加されたタスク予算機能を「暴走コストを止める安全弁」として歓迎しており、Auto Mode単体ではなくこの予算機能を併用する運用が安全側の設計となる。
影の側面は深い。冒頭で引用したyotta氏の事例に加えて、GitHub Issueにも実害寄りの報告が残っている。
- Issue #38618:Sonnet 4.6分類器がダウンし、
terraform versionやterraform state listといった無害なコマンドまで全ブロック。「Only read-only file tools work. I cannot run any commands right now」(@ahmad-asmar、3月25日) - Issue #46616:Maxサブスクライバーであるにも関わらずフッターに「auto mode is not available for your plan」と表示される認証バグ(@yasserstudio、4月11日)
- Issue #49837:分類器がSonnet 4.6ではなくOpus 4.7を呼び出す挙動の報告
要約すると、Auto Modeは分類器という単一障害点(SPOF)に依存している。分類器自体が落ちると操作不能になり、誤検知でも誤承認でも結果のリスクは最終的にユーザー側に帰属しうる。Anthropic自身が「リスクをゼロにするわけではない」と明言し、隔離環境での利用を推奨している事実は重い。
Pro / Max 5x / Max 20x / API:4プランの選び方
ここからが本題、月額のリアルだ。Anthropic公式の料金ページによると、2026年5月時点でMax 5xは100ドル、Max 20xは200ドル(米ドル建て、税別、月額のみ)。Pro($20)とAPI従量課金(Opus 4.7の入出力トークン課金)を加えた4プランで、フリーランスにとっての選び方を整理する。
| 想定利用パターン | 推奨プラン | 月額目安 | 補足 |
|---|---|---|---|
| Claude Codeを1日1〜2時間、軽量タスク中心 | Pro | $20 | xhighはOpus 4.7で利用可、Auto Modeは非対応 |
| 1日3〜5時間、リファクタやエージェント業務含む | Max 5x | $100 | Auto Mode + xhighがフル稼働、5x = Pro比5倍の使用上限 |
| 常駐クライアント案件で大規模リファクタ常連 | Max 20x | $200 | 上限到達リスクが下がり、/ultrareviewとの併用も現実的 |
| スポット案件、月次でばらつく | API従量 | 変動 | チームで使い回せるが、Auto Modeは非対応 |
判断軸は「Auto Modeをいくらの精神的コスト削減と評価するか」「xhighでの使用上限到達回数」の2つに集約される。Pro契約者で承認プロンプト対応に月10時間以上を奪われている人なら、Max 5xへの移行で月80ドル増の負担に対し、時給換算で1時間あたり8ドル相当の時間が戻る計算になる(あくまで仮定の試算)。一方、業務の大半が単発のスニペット生成や型エラー修正なら、Proのままでも/effort medium運用で十分対応できるケースが多い。
注意点を1つ。4月21日にA/Bテストでごく一部のProユーザーから一時的にClaude Codeが消える事案が起きており(即日撤回、uravation.com解説)、Anthropic側が将来的にPro→Max移行の圧力をかけてくる可能性は読み取っておく方がよい。
PMとして自分のClaude Code利用を観察した結論を書く。リサーチや要件定義のドラフト、軽量な実装相談が中心の自分には、Maxへの移行は現時点で見送りが妥当だ。Auto Modeで自走させたい長時間タスクが日常的に発生していないし、/ultrareviewはPRごとに従量で支払う方が読み込みやすい。逆に、フルスタック開発に常時Claude Codeを噛ませているフリーランスエンジニアなら、Max 5xは試す価値がある。ただし最初の1か月は隔離プロジェクトでAuto Modeを慣らし、yotta氏のような「信頼できなくなった」事例に自分が当たらないかを実地で確認することを強く勧める。
Auto Modeを最低限安全に使う3つの設定
PMとしての理解では、Auto Modeはツールではなく運用ルールで安全性が決まる類の機能だ。Anthropic公式とGitHub Issueから集めた最低限の防衛策を3つだけ挙げる。
- 隔離環境を分ける:本番リポジトリの直下では走らせない。コンテナ内、もしくは別物理ディレクトリで動かすことで、誤承認の影響範囲を限定する
/effortを意図的に下げる:分類器の誤判定とxhighのトークン浪費が重なる最悪パターンを避ける。自走タスクはmedium/highで十分なケースが多い- タスク予算機能を併用する:v2.1.111前後で導入されたタスク予算で「最大いくらまで使ってよい」を明示し、暴走コストの上限を設定する
これらは「Auto Modeが信用できる前提」ではなく「信用できない可能性に備える前提」で組まれた最低ラインだ。
Claude Codeのプラン仕様・料金は変動が早い領域だ。Anthropic公式の料金ページ、CHANGELOG、Claude Code DocsのModel Configurationで最新の挙動を確認してから判断することを勧める。
関連記事
- Claude Code Auto Mode完全ガイド|承認地獄から解放される新機能
- Claude Code 5月アップデート|/ultrareview・/recap・プッシュ通知完全ガイド
- Claude Opus 4.7のコスト実態|価格据え置きでも実質増えるトークン課金の正体
- Claude Pro月額20ドルは元が取れるか|2026年版の損得分岐点
本記事の情報は2026年5月4日時点のものです。料金・プラン仕様・モデル対応状況はAnthropicの公式サイトで最新情報を確認してください。Auto Modeはリサーチプレビュー段階の機能を含み、仕様は予告なく変更される場合があります。為替レートによる日本円換算は変動します。記事中で引用したベンチマーク数値、ユーザー体験談はそれぞれの出典元の記載に基づいています。