メインコンテンツへスキップ
AI News 14分で読める

UberのAI予算が4ヶ月で消えた理由|Claude Codeとトークン課金の罠

「予算の計算を最初からやり直すことになった。4月の時点で、2026年分はもう全部吹き飛んでいた」。Uber CTOのプラヴィーン・ネパリ・ナガは2026年4月、The Informationにそう打ち明けた(The Information, 2026年4月)。

Uberの2026年AI予算は、年明けから4ヶ月も経たないうちに消滅した。約5,000人のエンジニアへのClaude Code展開を始めたのは2025年12月。3ヶ月後の2026年3月には、エンジニアの84%が「エージェント型コーディングユーザー」に分類されていた。コミットされたコードの70%がAI生成というデータもある(Storyboard18, 2026年5月)。

この記事はこんな人におすすめ
  • Claude CodeやCursorを業務で使っており、月次コストの増加が気になる開発者
  • AI開発ツールの企業展開を担当しているエンジニアリングマネージャーやCTO
  • 生成AIの予算管理や費用対効果を把握しようとしているCFO・財務担当者

3ヶ月で採用率が2.6倍になった経緯

2025年12月、Uberは全エンジニアへClaude Codeを展開した。採用率は12月の32%から2026年2月には63%へ倍増し、3月末には84%に達した。月1回以上AIツールを使うエンジニアの比率は95%に上る(Startup Fortune, 2026年5月)。

急成長の背景にあったのは社内のリーダーボード制度だ。チームごとのAIツール利用量をダッシュボードで可視化し、内部ランキングを競わせた。採用促進の意図で設計されたこの仕組みは、意図通りに機能した。ただし予算消費量も同時に急増する形で。予算管理を担う部門とAI推進部門が組織として分断されており、ガバナンスの穴が生じた。

ナガCTO自身も例外ではなかった。2時間のデモセッション1回だけで約1,200ドルを消費したという。月次の平均コストはエンジニア1人あたり150〜250ドル。ヘビーユーザーに限れば500〜2,000ドルに跳ね上がった(Yahoo Finance, 2026年5月)。

アジェンティックAIが「想定外に高い」根本理由

問題の核心は課金モデルにある。GitHub CopilotなどのシートAIは月額19〜39ドルの定額制だが、Claude CodeはトークンベースのAPI課金だ。エージェント型AIは1回のタスクで従来のチャットAIの5〜30倍、場合によっては1,000倍ものトークンを消費する(Tom’s Hardware, 2026年5月)。

コードを読み込み、計画を立て、実装し、テストを走らせる。その各ステップがすべてトークンに変換される。あるユーザーはClaude Codeを一晩つけっぱなしにして、翌朝6,000ドルの請求書を目にした(MakeUseOf)。企業のAI予算はチャットAI時代の想定で組まれており、アジェンティックAIに対して構造的に過小だった。

MicrosoftとMeta、Amazonにも広がる「予算崩壊」

Uberは特例ではない。MicrosoftはUberと同じ2025年12月にExperiences & Devices部門(Windows・Microsoft 365・Outlook・Teamsを開発)でClaude Codeを社内展開した。しかし2026年5月、同部門は6月30日付けでClaude Codeのライセンスを打ち切ると通告。エンジニアはGitHub Copilot CLIへの移行を求められた。自社AIより競合ツールを好む社員が続出するという皮肉な構図が生まれた(The Next Web, 2026年5月)。

MetaとAmazonでは「トークンマキシング(tokenmaxxing)」と呼ばれる現象が確認された。社内リーダーボードのランクを上げるために、わざと大量のトークンを消費させる行為だ。Amazonでは内部ツール「MeshClaw」を使ってランキングを水増しするチームまで現れた(Tom’s Hardware, 2026年5月)。Nvidiaの応用ディープラーニング担当VPであるブライアン・カタンザロも「私のチームでは、コンピュートのコストが社員の人件費を超えた」と述べている(Fortune, 2026年5月22日)。

ROIは証明できているのか

Uber COOのアンドリュー・マクドナルドは後の取材でこう述べた。「トークン消費量が増えることで、ユーザー向けの機能リリースが増えているかというと……そのリンクはまだ確立されていない」(Yahoo Finance, 2026年5月)。

Deloitteの調査によれば、2026年においてAI投資の56%はROIゼロだという(Deloitte, 2026年)。生産性向上の実感は66%の組織が報告するが、財務成果に転換できているのは20〜30%に過ぎない。Goldman Sachsはアジェンティック採用が本格化する2030年までにトークン消費が現在の24倍に達すると試算しており、今回の問題はむしろ序章に過ぎない可能性がある。

「AI FinOps」という新たな対応策

こうした状況を受け、クラウドコスト管理の手法をAIトークン消費に応用する「AI FinOps」が注目されている。500人規模の開発組織が1四半期でAIツール代として87,000ドルを使い、対策導入後にコストを60〜80%削減した事例も報告されている(Sphere Partners)。

GitHub Copilotは2026年6月1日から従量課金への移行を発表しており、業界全体がシート課金からトークン課金へと移行しつつある。この流れは止まらない。課金モデルが変わる以上、予算管理の方法論も変えるしかない。

Hacker Newsのスレッド(339コメント、4時間で347ポイント)では「生産性向上は本物だが価格は持続不可能」「月1万ドル費やす開発者が10万ドルの価値を出せるか証明できるのか」という議論が続いた(Hacker News)。Uberの事例が示すのは、AIツールの導入成功と予算管理の成功は別物だという事実だ。

AI予算暴走を防ぐ「AI FinOps」3つの基本対策
  1. トークン予算の上限設定: APIキーごとに月次上限を設け、使用量が50%・80%・100%に達したら自動アラートを設定する
  2. モデルルーティング: タスクの難易度に応じて安価なモデルに振り分ける。インテリジェントルーティングでコスト60〜80%削減の事例がある
  3. エージェント実行の時間制限: 長時間セッションへのタイムアウト設定で再帰ループや不要な並列実行を自動停止する

Claude Codeの実運用コストを最適化したい開発者へ

Uberの事例はClaude Codeの採用コストが予測困難であることを示している。コスト管理の第一歩はAPIレベルの使用量把握から。関連記事でClaude Codeの費用構造を確認しよう。

Claude Code最新アップデートを確認する

関連記事


本記事に記載された数値・引用は各リンク先の報道に基づく。Uberの具体的なAI予算総額は同社から公式に開示されていない。為替レートは執筆時点のものであり、変動する場合がある。

Share