メインコンテンツへスキップ
AI Tools 21分で読める

Claude API 4月アップデート|Web検索・コード実行・メモリが正式版に

この記事はこんな人におすすめ
  • Claude APIを使ってプロダクトやエージェントを開発しているエンジニア
  • Web検索やコード実行をAIアプリに組み込みたい方
  • OpenAI APIとの料金・機能比較を知りたい方

「Claude APIのWeb検索、地味に精度上がってない?」

Qiitaユーザーのkai_kou氏が2026年3月末に公開した検証記事が、開発者コミュニティで静かに拡散された。ツールバージョンを1行変えただけで、検索精度が11%向上し、トークン消費が24%減ったという報告だ。

この変化の裏にあるのが Dynamic Filtering(検索結果から不要な情報をコード実行で自動除去する技術)だ。そしてこれは、2026年4月にAnthropicが一斉にGA(General Availability=正式リリース)した複数の機能アップデートの一部にすぎない。Web検索、コード実行、メモリ、プログラマティックツール呼び出し。ベータの段階で個別に試していた開発者も多いだろうが、すべてが正式版になったことで「本番環境に入れていい」フェーズに入った。

この記事では、各機能の技術的な詳細、料金、そして実際に使った開発者の声を整理する。

Web検索 Dynamic Filtering:何が変わったのか

仕組み

従来のWeb検索は、検索結果の生HTMLをそのままコンテキストウィンドウに流し込んでいた。ナビゲーション、フッター、広告。すべてがトークンとして消費される。

Dynamic Filteringでは、Claudeが検索結果を受け取った直後にPythonコードを自動生成・実行し、不要な部分を除去してから推論に入る。いわば「読む前に整理する」プロセスが挟まる。

Zennユーザーのtoku7氏はこの仕組みを詳細に分析し、バックエンドで最大10回の反復ループが走るサーバーサイドのサンプリング機構を発見している(toku7氏の検証記事)。検索戦略をLLM自身に組み立てさせるアーキテクチャは、単純な「検索→要約」とは根本的に異なる。

ベンチマーク結果

Anthropicが公開したベンチマークの数値は具体的だ。

ベンチマークモデルフィルタなしフィルタあり改善幅
BrowseCompSonnet 4.633.3%46.6%+13.3pt
BrowseCompOpus 4.645.3%61.6%+16.3pt
DeepsearchQA (F1)Sonnet 4.652.6%59.4%+6.8pt
DeepsearchQA (F1)Opus 4.669.8%77.3%+7.5pt

平均で精度+11%、入力トークン-24%。精度が上がってコストが下がる。ほとんどの開発者にとって見送る理由が少ない改善だ。

※BrowseCompはWeb上の事実検索精度、DeepsearchQAは複雑な調査クエリへの回答精度を測定するベンチマーク。

出典: Improved Web Search with Dynamic Filtering | Claude公式ブログ

使い方

ツールバージョンを web_search_20260209 に指定するだけ。Opus 4.6とSonnet 4.6ではデフォルトで有効になっている。

{
  "model": "claude-sonnet-4-6-20260217",
  "max_tokens": 4096,
  "tools": [
    { "type": "web_search_20260209", "name": "web_search" },
    { "type": "web_fetch_20260209", "name": "web_fetch" }
  ],
  "messages": [{ "role": "user", "content": "..." }]
}

ベータヘッダーは不要。GA(一般提供)済みだ。

料金

  • Web検索: 1,000検索あたり$10(+通常のトークン課金)
  • Webフェッチ: 追加料金なし(通常のトークン課金のみ)
  • Dynamic Filteringのコード実行: 無料

この料金設定は競合と比較すると明確な優位性がある。OpenAIのWeb検索は1,000クエリあたり$25〜30。さらにOpenAIは1回の検索ごとに8,000入力トークンのブロック課金が加算される。Claudeの方が半額以下だ。

開発者の声

kai_kou氏(Qiita)はベンチマーク通りの改善を確認しつつ、注意点も指摘している。

Dynamic FilteringはGoogle Vertex AIでは利用不可。Claude APIとAzureのみ対応。ゼロデータリテンション(ZDR)とも併用できない。本番導入前に実際のクエリセットで事前評価すべき

note.comのしおどめ氏は、Dynamic Filteringを活用した「RAGレス」エージェント開発を紹介し、従来のRAGパイプラインと比べて80%のコスト削減が可能だと報告した。自前のベクトルDBやインデックス構築が不要になるケースがある、という主張だ。

ただし批判的な声もある。Wire創設者のChristopher Helm氏は、Claude Codeのソースコード流出をきっかけにWeb検索の内部処理を分析した。検索結果のHTMLからMarkdownへの変換にカスタム設定がなく、JSON-LDやalt-textが除去される点を問題視している。107の事前承認ドメイン以外はHaikuモデルが125文字制限で要約する構造も明らかになった。

Vertex AIユーザーへ

Dynamic FilteringはClaude API(Anthropic直接)とMicrosoft Azureでのみ利用可能だ。Amazon BedrockやGoogle Vertex AI経由では使えない。Vertex AIユーザーがこの機能を使いたい場合は、Web検索部分だけAnthropic APIを直接呼ぶ構成を検討する必要がある。

コード実行ツール:GA化で何ができるようになったか

コード実行ツールは2025年8月のベータ開始から約半年を経て正式版になった。

できること

サンドボックス化されたコンテナ内でPythonとBashを実行できる。コンテナのスペックは以下の通り。

  • Python 3.11.12、Linux x86_64
  • RAM 5GiB、ディスク 5GiB、CPU 1コア
  • インターネットアクセスなし(完全サンドボックス)
  • コンテナの有効期限: 作成から30日
  • アイドルタイムアウト: 4.5分

pandas、numpy、matplotlib、scikit-learnなど主要なデータ分析ライブラリがプリインストールされている。

料金体系

ここが重要だ。

  • Web検索・Webフェッチと併用時: 無料
  • 単体利用: 月1,550時間の無料枠。超過分は$0.05/時間/コンテナ

月1,550時間は、1日あたり約50時間。個人開発者やスタートアップなら無料枠内で収まるケースがほとんどだろう。

競合との比較

ChatGPTのCode Interpreterはブラウザ内でのインタラクティブなデータ分析に強い。CSVをアップロードして即座にグラフ化する体験は洗練されている。

一方でClaudeのコード実行はエージェント的な自律実行に向いている。コードを書き、実行し、エラーを確認し、修正する。このループを人間の介入なしに回せる点が、Claude Agent SDKと組み合わせたときに真価を発揮する。

メモリツール:会話を超えた記憶

メモリツールもGA化した。2025年9月のベータから約7か月。

仕組み

/memories ディレクトリにファイルとして情報を保存・読み出しする、クライアントサイドのツールだ。ストレージの実体はアプリケーション側にあるため、開発者が完全にコントロールできる。

対応操作:

  • view — ディレクトリやファイルの内容を表示
  • create — 新規ファイル作成
  • str_replace — テキスト置換
  • insert — 指定行に挿入
  • delete — ファイルやディレクトリを削除
  • rename — ファイル名の変更

パフォーマンス

Anthropicの内部評価では、メモリツールとコンテキスト編集の組み合わせでベースラインから39%の性能向上を確認。100ターンのWeb検索評価ではトークン消費が84%削減されたという。

長時間のエージェントセッションで「同じことを何度も聞いてくる」問題が大幅に緩和される。PMとして複数のAIツールを評価してきた立場から言えば、メモリ機能の有無はエージェントの実用性を左右する決定的な要素だ。

プログラマティックツール呼び出し:トークン消費が1/10に

これは地味だが影響が大きい機能だ。

従来、Claudeが複数のツールを呼び出すたびにモデルとの往復が発生し、各ツールの結果がトークンとして消費されていた。プログラマティックツール呼び出しでは、Claudeがコード実行コンテナ内からツールを直接呼び出す。

10個のツールをプログラマティックに呼び出した場合、トークン消費は直接呼び出しの約1/10

ツール定義に allowed_callers フィールドを追加するだけで有効にできる。

{
  "name": "get_weather",
  "allowed_callers": ["direct", "code_execution_20260120"]
}

ただし制約もある。MCP(Model Context Protocol、AIと外部ツールをつなぐ標準プロトコル)コネクタ経由のツールはプログラマティック呼び出しに対応していない。構造化出力(strict: true)との併用も不可だ。

300kトークン出力と1Mコンテキストの変更

300k出力(Batches API限定)

output-300k-2026-03-24 ベータヘッダーを指定すると、max_tokens の上限が300,000に引き上げられる。Opus 4.6とSonnet 4.6で利用可能。ただしBatches API(非同期で大量のリクエストを一括処理するAPI)のみの対応で、リアルタイムAPIでは使えない。

1回の生成に1時間以上かかることもある。24時間のバッチ処理ウィンドウ内で計画的に使う必要がある。

1Mコンテキスト:旧モデルは4月30日に終了

Claude旧モデル一斉終了の記事でも触れたが、2026年4月30日をもってSonnet 4.5とSonnet 4の1Mコンテキストベータが終了する。context-1m-2025-08-07 ヘッダーは無効になり、20万トークンを超えるリクエストはエラーを返す。

一方、Opus 4.6とSonnet 4.6では1Mコンテキストが標準機能として無料で使える。ベータヘッダー不要、追加料金なし。90万トークンのリクエストも9千トークンのリクエストも、トークン単価は同じだ。

移行していないプロジェクトは、今月中に対応が必要だ。

移行のポイント

Sonnet 4.5 → Sonnet 4.6への移行は基本的にドロップインで動作する。APIのモデルIDを claude-sonnet-4-6-20260217 に変更し、ベータヘッダーを削除するだけだ。ただし出力の傾向が若干変わる可能性があるため、テストは必須。

競合との立ち位置

2026年4月時点でのAPI機能比較を整理する。

機能Claude APIOpenAI APIPerplexity SonarGemini
Web検索コスト$10/1K検索$25〜30/1K検索$5/1Kリクエスト(raw)Vertex AI従量課金
検索精度の独自技術Dynamic Filtering (+11%)幅広いWebインデックス引用精度が最高Google検索インデックス直結
コード実行サンドボックス+エージェント的自律実行ブラウザ内データ分析なしAPI単位で利用可能
コンテキスト長1M トークン128K〜1M(モデルによる)モデル依存1M+

OpenAIは「スーパーアプリ」戦略でChatGPTにブラウザ・Codex・アプリストアを統合する方向に舵を切っている。Apps SDKはMCPベースで構築されており、皮肉にもAnthropicが提唱したプロトコルがOpenAIのプラットフォームの基盤になっている。

Anthropicは消費者向けプラットフォームではなく、開発者向けインフラに集中している。ツールの精度と料金で勝負する姿勢は、PMとして見ると筋が通っている。プラットフォームの覇権争いはOpenAIとGoogleに任せ、その両者のプラットフォーム上で動くエージェントの「頭脳」を提供する。実際、Microsoft Copilot CoworkはClaudeとGPTの両モデルを搭載しており、マルチモデル時代の到来を裏付けている。

電脳狐影の評価

PMとして率直に言う。今回のGA一斉リリースは、個々の機能より**「全部揃った」こと**に意味がある。

Web検索で情報を取り、コード実行でデータを整理し、メモリで前回の結果を覚えておく。このループが全て正式版になったことで、本番環境のエージェントに安心して組み込めるようになった。

自分なら、まずDynamic Filteringから試す。ツールバージョンを1行変えるだけで精度が上がりコストが下がる。コード変更が最小限なので移行コストが極めて低い。

ただし懸念もある。Vertex AIやBedrockのユーザーは恩恵を受けられない機能が多い。Anthropicが直接APIを優遇する傾向が強まっている点は、クラウドベンダー経由で利用している企業にとって無視できないリスクだ。

Claude APIを試してみる

Dynamic Filteringは既存のWeb検索ツールのバージョンを変更するだけで有効になる。無料枠内で十分に検証可能だ。

Claude API ドキュメント

関連記事

※記事内の料金・仕様は2026年4月4日時点の情報に基づく。最新情報はClaude API公式ドキュメントを確認のこと。

出典:

Share