Claude appsゲートウェイ完全解説|AI予算崩壊をAPI鍵なしで封じる新制御基盤
「今日、LindyのトラフィックをDeepSeek v4に100%切り替えた。Anthropicから完全撤退する。数百万ドルの節約になる」。AI エージェントスタートアップ Lindy CEOのFlo Crivellaは2026年6月、Xにそう投稿した(X / @Altimor, 2026年6月)。
Uberは年間AI予算を4ヶ月で使い果たし、GitHub Copilotは定額プランを廃止してAIクレジット制の従量課金に移行した。根本にある問題は同じだ。APIキーを開発者に野放しで配布し、誰が何トークン使っているか見えない状態でエージェント型AIを展開すると、予算管理が機能しなくなる。
Anthropicはこの問題に対する答えとして、2026年6月30日にClaude appsゲートウェイをリリースした(Anthropic公式, 2026年6月30日)。Claude Sonnet 5と同日に発表された自社ホスト型コントロールプレーンで、企業がClaudeをAWS・GCP・Azure経由で社内展開する際のSSO認証・モデルアクセス制御・スペンド制限・テレメトリを一元管理できる基盤だ。
- Claude CodeをAWS Bedrock・Google Cloud・Foundry経由で社内展開しているDevOpsエンジニアへ
- AI開発コストのガバナンスに悩むエンジニアリングマネージャー・CTO・CFOへ
- 開発者ラップトップにAPIキーを置かずにセキュアなAI環境を構築したいセキュリティ担当者へ
Claude appsゲートウェイとは何か
Claude appsゲートウェイは、Claude Codeクライアントとクラウドプロバイダーの間に挟む自社ホスト型のプロキシサーバーだ。claudeバイナリに同梱されており、claude gateway --config gateway.yamlという1コマンドで起動する。LinuxコンテナとPostgreSQL 14以上があれば動く(Anthropic Docs, 2026年6月30日)。
開発者視点では「ログイン方法が変わるだけ」だ。/loginを実行すると自社のOIDC IdP(Okta・Microsoft Entra ID・Google Workspace・Keycloak等)のサインイン画面が開き、会社アカウントで認証する。それ以降は通常のClaude Codeとまったく同じように使える。APIキーもクラウド認証情報も不要だ。認証トークンはゲートウェイサーバー側のみに保管され、開発者のラップトップには残らない。
対応するクラウドプロバイダーはAmazon Bedrock・Google Cloud Vertex AI Agent Platform・Microsoft Foundry・Anthropic直接APIの4つ。複数のupstreamを設定してフェイルオーバーも組める。例えばBedrockを主系として、Foundryをバックアップに設定することが可能だ(Google Cloud Blog, 2026年7月)。
APIキー野放し問題がどこまで深刻だったか
なぜ今このゲートウェイが必要なのか。背景を整理する。
UberのCTOがAI予算崩壊を告白したのは2026年4月だ。5,000人のエンジニアにClaude Codeを展開した結果、3ヶ月で採用率が84%に達し、年間AI予算が4月の時点で底をついた。コミットされたコードの70%がAI生成というデータもある(Storyboard18, 2026年5月)。
問題の構造はシンプルだ。エンジニア個人にAnthropicのAPIキーを配布する形では、誰がどのモデルをどれだけ使っているかを組織として追跡できない。GitHubも同じ罠にはまり、CopilotのエンタープライズプランをAIクレジット制の従量課金に移行した。「エージェント型セッションがコストを押し上げ、定額モデルでは吸収しきれなくなった」と公式ブログで認めた(GitHub Blog, 2026年6月)。
Salesforceは2026年の年間Anthropic支出が約3億ドルに達する見込みだと明かしている(CNBC, 2026年6月)。エンタープライズ規模でAIを使う企業にとって、モデルへのアクセス制御とコスト可視化は「あると便利」な機能ではなく、予算管理の基盤として必要な要素になりつつある。
主要機能を解剖する
SSO認証:API鍵がラップトップを去る日
ゲートウェイに/loginするとIdPのサインイン画面が開く。認証成功後に発行されるのはセッションごとの短命ベアラートークン(デフォルト有効期限1時間)で、ゲートウェイが更新を管理する。IdPから削除されたユーザーは次のセッション更新で自動的にアクセスを失う。オフボーディングはIdP側の操作1つで完結し、全員に「APIキーを無効化してください」とメールする必要がなくなる。
グループ別RBAC:チームごとにモデルとポリシーを分離
gateway.yamlのmanaged.policiesブロックでIdPグループとモデルアクセスをマッピングできる。例えばシニアエンジニアグループにはclaude-opus-4-8を解放し、インターンにはclaude-haiku-4-5のみ許可する設定が数行で書ける。リクエストされたモデルがポリシーで許可されていない場合、ゲートウェイはサーバーサイドで400を返す。ローカルの設定ファイルを編集しても無効だ。
設定変更はゲートウェイの再デプロイで即時反映される。クライアント側のアップデートは不要で、MDMを再配布する必要もない。
スペンド制限:予算崩壊を構造的に防ぐ
ユーザー単位・グループ単位・組織単位で日次・週次・月次の上限を設定できる。上限到達時は429レスポンスを返し、それ以上のトークン消費がブロックされる。トークンメータリングはPostgreSQLに記録され、管理APIで照会できる。「月の最初の1週間で予算の半分が消えた」というパターンを構造的に防ぐ仕組みだ。
OTLPテレメトリ:誰が何トークン使ったか把握できる
すべてのリクエストにメールとIdPグループのメタデータが付与され、OTLP(OpenTelemetry Protocol)/HTTP形式で指定したコレクター(Datadog・Splunk・ClickHouse等)に転送される。テレメトリの送信先は組織側で管理する。ゲートウェイ自身はAnthropicのインフラに使用データを送らない。プロンプトやレスポンスの内容はログに記録されないが、コマンドやファイルパスを含むトレース情報は組織側の設定次第で記録できる。
セットアップ要件と現在の制限事項
最低限必要なもの
| 要件 | 詳細 |
|---|---|
| Claude Code バージョン | v2.1.195以上(サーバー・クライアント両方) |
| Identity Provider | Okta・Microsoft Entra ID・Google Workspace等、OIDC対応IdP |
| データベース | PostgreSQL 14以上(最小マネージドティアで十分) |
| サーバーOS | Linux(macOSは開発用のみ、Windowsは非対応) |
| ネットワーク | 社内プライベートネットワーク上に配置必須 |
Claude Code v2.1.195未満のバージョンはclaude gatewayサブコマンド自体が存在しない。展開前にクライアント側のアップデートを確認する必要がある。
現時点で使えない機能
ゲートウェイ経由のセッションには制限がある。ウェブ検索ツール(WebSearch)が無効になる。ゲートウェイがどのupstreamにルーティングするか検出できないため、検索非対応のプロバイダーに転送されるリスクを避けるための仕様だ。またプロンプトキャッシュの有効期限が5分に固定される(通常の1時間TTLキャッシュは利用不可)。
CIパイプラインには使えない。ゲートウェイのサインインは常にブラウザのデバイスコードフローを必要とするため、無人環境(CIジョブ)は従来通りプロバイダー直接認証を使う必要がある。
その他の非対応項目:SAML・LDAP認証、マルチテナント(複数OIDCイシュアー)、管理UI、Helmチャートによるデプロイ。
Claude Enterpriseとの使い分け
データ居住地要件がない場合や、SCIM自動プロビジョニング・モバイル版Claude Codeが必要な場合はClaude Enterpriseの方が適している。「既存のAWS/GCP/Azureインフラ上にデータを置きたい」「クラウドプロバイダーへの一本化課金にしたい」という要件があればClaude appsゲートウェイが有効な選択肢だ。
光と影:Claude appsゲートウェイが解決すること・しないこと
解決すること
- 開発者ラップトップへのAPI鍵配布をゼロにする
- 誰がいつ何トークン使ったかをIdPグループ単位で追跡
- チーム別・ユーザー別のスペンド上限設定
- 退職者のアクセスをIdP操作1つで遮断
解決しないこと
- CIパイプラインの無人認証(直接プロバイダー認証が必要)
- ゲートウェイ自体のメンテナンスコスト(自社運用)
- ウェブ検索ツールの利用(ゲートウェイ経由では無効)
- プロンプトキャッシュ1時間TTLの活用(5分に制限)
Claude appsゲートウェイを試す前に確認すること
公式ドキュメントのClaude appsゲートウェイ設定リファレンスとデプロイメントガイドで、IdPごとの詳細設定・Kubernetes/Cloud Runへの本番デプロイ手順を確認してから着手することを勧める。Claude Code v2.1.195以上へのアップデートを先に済ませておくこと。
関連記事
- UberのAI予算が4ヶ月で消えた理由|Claude Codeとトークン課金の罠
- GitHub Copilot従量課金移行:月$39が2時間で消えた開発者の怒りと代替ツール選び
- ClaudeがAzure Foundry正式版に|自社エンジニア禁止・顧客解禁のMicrosoftの矛盾
- Claude Sonnet 5完全解説 — エージェント特化の中間モデルと3つの破壊的変更
本記事の情報は2026年7月2日時点のものです。Claude appsゲートウェイは継続的にアップデートされており、機能・制限は変更される可能性があります。最新情報は公式ドキュメントを参照してください。本記事はAnthropic・AWS・Google・Microsoftから広告費・PR支援を受けて作成したものではありません。