Claude Managed Agentsの「Dreaming」。眠っている間にAIが賢くなる仕組みと業務活用の現実
「Harveyのエージェントは、Dreamingを有効にしてから完了率が約6倍に上がった」。Anthropicの公式ブログ(claude.com)に掲載されたこの数字を見たとき、素直に「本当か?」と思った。
完了率「6倍」はマーケティング文句として使われがちな数字だ。だが背景を追うと、Harveyが直面していた問題は再現性が高い。法律文書の処理を担うエージェントが、セッションをまたぐたびに同じファイル形式の制約に引っかかり、同じワークアラウンドを毎回「発見し直して」いた。記憶が引き継がれないから、同じ失敗を繰り返す。Dreamingはその構造問題に対処するための機能だ。
2026年5月6日、AnthropicはサンフランシスコでCode with Claude開発者イベントを開催し、Claude Managed Agentsに3つの新機能を発表した。なかでも最も注目を集めたのが「Dreaming(ドリーミング)」だ。エージェントが稼働していない時間に、過去のセッション履歴を自律的に整理・学習するバックグラウンド処理機能である。
- Claude Managed AgentsやAPIを業務に導入している開発者・エンジニア
- AIエージェントの「記憶」管理に課題を感じているシステム設計者
- Dreamingの技術的な仕組みとビジネス活用事例を把握したい方
Dreamingとは何か。「眠ることで賢くなる」機能の正体
Dreamingは、エージェントがアイドル状態のときに動作するスケジュール済みバックグラウンドプロセスだ。仕組みは以下の流れになる。
- 過去最大100セッションの会話履歴と既存のメモリストア(エージェントが参照するテキスト形式の記憶領域)を入力として受け取る
- 重複したエントリを統合し、矛盾する記録や陳腐化した情報を最新値に更新する
- 単一セッションからでは見えなかったパターン(繰り返すミス、複数エージェントが収束したワークフロー、チーム共通の好みなど)を抽出する
- 元のメモリストアは変更せず、新しい出力用メモリストアを別途生成する
重要なのは「モデルの重みを変えない」点だ。DreamingはベースモデルであるClaudeそのものを再学習するわけではない。エージェント固有の動作メモリ(プレーンテキストのノートと構造化された「プレイブック」)を整理・更新する処理であり、内容は開発者がいつでも閲覧・削除できる。
Xでは日本の開発者からも「これはファインチューニングではなく、RAGのデータを自動整備するイメージに近い」(@tetumemo)という整理が広まっており、実態をよくとらえている。
同時発表の3機能:Dreaming・Outcomes・マルチエージェントオーケストレーション
Code with Claude 2026で発表された新機能は3本立てだ。Dreamingだけを単独で理解しても全体像がつかみにくいため、整理しておく。
| 機能 | ステータス | 一言説明 |
|---|---|---|
| Dreaming | リサーチプレビュー | セッション間の記憶整理・自己改善 |
| Outcomes | パブリックベータ | エージェントが自分の出力を採点・再実行 |
| マルチエージェントオーケストレーション(複数AIの指揮・調整) | パブリックベータ | リードエージェントが専門エージェント最大20体に並列委譲 |
Outcomesはエージェントに「採点基準」を渡し、出力がその基準を満たさなければ自動的に再試行させる機能だ。InsurTechのWisedocsはこれを使い、保険文書のレビュー時間を50%削減したと報告している(claude.com)。
マルチエージェントオーケストレーションはNetflixが活用しており、数百件のビルドログを並列処理してパターンを抽出している。最大20体のスペシャリストエージェントが共有ファイルシステム上で同時稼働する。
DreamingとOutcomesは組み合わせると効果が大きい。Outcomesで失敗と判定されたセッションのパターンをDreamingが抽出し、次の実行に活かす流れが想定されている。
実績データと採用事例
Harvey:完了率が約6倍に
法律AIスタートアップのHarveyは、Claude Managed Agentsを使って長文法律文書の作成・編集を担わせている。問題は、エージェントがセッションをまたぐたびにファイル形式の制約やツールの挙動を「忘れ」、同じワークアラウンドを再発見するコストが積み重なっていたことだ。
Dreamingを導入後、エージェントは過去の作業から「このファイル形式はこのツールで処理する」「このドキュメント構造ではこのアプローチが機能する」といったパターンを抽出してメモリに保持するようになった。結果として、タスク完了率が約6倍に向上したと報告している(VentureBeat)。
Wisedocs:文書レビュー時間50%削減
保険文書を扱うWisedocsは、Outcomesを用いた自己評価ループで文書レビューの品質基準への適合を自動チェックしている。この50%削減はOutcomesが主な要因で、エージェントが採点基準に達しない出力を自動で再試行するサイクルにより、担当者への引き渡しまでのターンが大幅に減った(claude.com)。
Netflix:数百件のビルドログを並列解析
Netflixのプラットフォームチームは、多数のマイクロサービスにまたがるビルドログを同時処理する問題にマルチエージェントオーケストレーションで対応している。リードエージェントがバッチを割り振り、スペシャリストが並列でパターンを解析して集約する仕組みだ(claude.com)。
光と影:Dreamingの限界とリスク
できること・できないこと
Dreamingは「同じ失敗を繰り返す問題」には有効だが、万能ではない。現時点での制約は下記のとおりだ。
- リサーチプレビュー段階:一般公開ではなく、アクセス申請と承認待ちが必要
- 対応モデルの制限:Claude Opus 4-7またはClaude Sonnet 4-6のみ
- コスト増:Dream処理は追加トークン消費を伴う。100セッション分の履歴を処理するコストは無視できない
- 入力上限:1回のDreamで処理できるセッションは最大100件。大規模運用では定期的なトリミングが必要
Noteで活発に議論されている点として「ClaudeのDreamingは”自己進化AI”ではない」(三原健人氏)という整理がある。Dreamingで賢くなるのはあくまでそのエージェントのメモリ層であり、Claudeモデル自体の能力は変わらない。「育てた部下」が引き継ぎ書を更新しているイメージだ。
プライバシーと信頼の問題
Dreamingの構造的な懸念は、Anthropicのインフラ上で複数セッションの業務データが横断的に解析されることだ。Anthropicは「メモリ変更はすべて監査可能で、自動更新か手動確認かを選択できる」としている。だが、機密情報を扱う法務・医療・金融系のエージェントに自動更新モードを適用することには慎重であるべきだろう。
開発者への推奨は「最初は手動レビューモードで運用し、出力メモリストアの内容を精査してから本番適用する」ことだ。出力は元のメモリストアとは独立して生成されるため、差分確認のコストは低い。
アクセス方法と技術仕様
アクセス申請
DreamingはClaude Managed Agentsのリサーチプレビュー機能のため、使用には申請が必要だ。フォームは claude.com/form/claude-managed-agents から送信できる。Outcomesとマルチエージェントオーケストレーションはパブリックベータのため申請不要だが、Managed Agentsの利用自体がAPI契約必須となる。
API仕様のポイント
Dreamingを呼び出すには managed-agents-2026-04-01 と dreaming-2026-04-21 の2つのベータヘッダーが必要だ。Dream処理はジョブとして投入し、pending → running → completed のライフサイクルをポーリングで追う非同期モデルになる。
# Dreamの仕様概要(2026年5月時点)
対応モデル: claude-opus-4-7 / claude-sonnet-4-6
最大セッション数: 100
処理時間: 数分〜数十分(入力量依存)
課金: APIトークン標準レート + $0.08/セッション時間
命令文字数上限: 4,096文字
公式ドキュメントは platform.claude.com/docs/en/managed-agents/dreams に公開されている。
OpenAI MemoryはChatGPTユーザーの個人設定・好みを会話から自動保存するユーザー向け機能だ。DreamingはAPIレベルで動作し、エージェントが複数セッションにわたる業務パターンを抽出する開発者向け機能。対象・粒度・制御レベルのいずれも異なる。ユーザーがChatGPTに「好きな言語はPythonだ」と伝えれば記憶されるのがMemory、エージェントが100回の法律文書処理から「.docxはOpusで前処理してからWorkerに渡す」というパターンを自動抽出するのがDreamingだ。
まとめ
Dreamingが解決する問題は明確だ。「セッションをまたぐと同じミスを繰り返すエージェント」という、繰り返し指摘されてきた課題に対して、エージェント自身が過去の履歴から学ぶメカニズムを提供する。
Harveyの6倍という数字は、問題が深刻だったからこそ出た改善幅だ。同じ失敗を繰り返さない仕組みが整うと、エージェントの信頼性と運用コストの両方が変わる。
ただし現時点ではリサーチプレビューであり、すべての開発者が即日使えるわけではない。コスト構造も含め、本番導入前に小規模なテストで挙動を検証してから判断するのが現実的だ。
Claude Managed Agentsの最新情報は claude.com/blog で随時更新されている。Dreamingのアクセス申請は claude.com/form/claude-managed-agents から行える。
関連記事
- Claude Orbit完全解説|毎朝GitHubとGmailを読むプロアクティブAI
- Claude Codeのキャッシュを1時間に戻す方法、ENABLE_PROMPT_CACHING_1Hの全て
- バイブコーディング入門|AIに「雰囲気」で指示する開発手法の光と影【2026年版】
本記事の情報は2026年5月12日時点のものです。Anthropicの機能仕様・価格・提供条件は予告なく変更されることがあります。最新情報は公式ドキュメントを参照してください。