Anthropic dreaming—Claudeが自己改善する仕組み

Anthropicは2026年5月6〜7日に開催した開発者向けイベント「Code with Claude」で、AIエージェントがセッションとセッションのあいだに自身の過去記録を見直して改善する「dreaming（ドリーミング）」機能を発表しました。法律AIのHarveyではタスク完了率が約6倍に向上し、医療文書審査のWisedocsでは審査時間を50%削減するという成果が報告されています。現在はAnthropicのManaged Agentsを使う開発者向けにリサーチプレビューとして提供されており、AIエージェントが「眠っている間に賢くなる」仕組みとして注目を集めています。

背景と文脈
技術/ビジネス面
これからどうなるか
まとめ
参考リンク

背景と文脈

従来のAIエージェントはセッションをまたいで学ぶことが難しい構造でした。ユーザーの好みや繰り返し起きるエラー、効率的なワークフローなどの知見は、ひとつのセッションが終わるとリセットされてしまいます。エージェントを長期的に育てたい開発者は、プロンプトに毎回ガイドラインを書き込むか、外部のメモリシステムを独自に実装するしかありませんでした。

Anthropicはこの問題を人間の脳の仕組みになぞらえて解決しようとしています。海馬（かいば）による記憶の固定化—人間の脳が睡眠中に一日の出来事を再生して重要な記憶を選別・定着させるプロセス—をAIエージェントに実装したのがdreamingです。

この発表はClaude Managed Agentsの新機能群の一部で、dreamingのほかに「outcomes（アウトカム）」と「multiagent orchestration（マルチエージェントオーケストレーション）」も同時に発表されました。三つを組み合わせることで、自律的に動作し、成果を計測し、複数のエージェントが協調するシステムを構築できます。

技術/ビジネス面

woman sitting on bed wearing pajama dreaming

dreamingは、エージェントのセッションが終わった後にスケジュール実行される自動プロセスです。過去のセッション記録とメモリストアをさかのぼり、以下のようなパターンを抽出します。

繰り返し発生しているミスと、その根本原因
複数のエージェントが独立して収束した「効率的なワークフロー」
チーム全体で共有されているユーザーの好みやルール

重要なのは、dreamingがモデルの重み（ニューラルネットワーク内部のパラメータ）を書き換えないという点です。代わりに、学んだ内容を「プレーンテキストのメモ」と「構造化されたプレイブック」として書き出し、次のセッションで参照できるようにします。この仕組みにより、学習プロセスが人間に見える形（オブザーバブル）になり、監査も可能です。

Harvey（法律業務向けAIプラットフォーム）の事例では、dreaming導入後にタスク完了率が約6倍に向上しました。エージェントが「前回このクライアントはこのファイル形式を好む」「この種のタスクでは確認が必要なエラーパターンがある」といった情報をセッション前から知っている状態で動くため、確認のやりとりの回数とエラー修正の手間が大幅に減ったためです。Wisedocs（医療文書審査AI）では同種の文書が大量に来る環境でdreamingが機能し、文書の構造パターン・頻出フィールドエラー・曖昧なケースの判断基準が蓄積されて、審査時間が50%短縮されました。

これからどうなるか

dreamingを利用するには、AnthropicのManaged Agentsを使う必要があります。生のClaude APIに直接つないでカスタムエージェントループを構築している場合は現時点では対象外です。言い換えると、Anthropicのオーケストレーション層を採用することで、この「自己改善」の恩恵を受けられます。

開発者の観点からは、エージェントの動作ログをManaged Agentsに接続するだけで、ユーザーごとの好みやエラーパターンが自動で蓄積されていく形になります。従来はプロンプトエンジニアリングで手動で管理していた「コンテキストの引き継ぎ」が、インフラレベルで自動化される方向です。エージェントを長期的に運用しているラボや企業にとっては、即戦力となる仕組みです。

Anthropicはリサーチプレビューとしての公開に留めており、今後はManaged Agentsを利用するすべてのユーザーへの提供拡大が予想されます。競合のOpenAIやGoogleもエージェントのメモリと継続学習に取り組んでおり、セッション間の改善能力がAIエージェントの差別化ポイントになる競争は今後も激化しそうです。

まとめ

AnthropicのdreamingはClaude Managed Agentsに追加されたセッション間自己改善機能です。睡眠中の脳の記憶固定化をモデルに、過去セッションのパターンを抽出してプレイブックとして次回に活かします。HarveyとWisedocsで実証された成果は、長期運用するエージェントの品質向上に大きな可能性を示しています。

参考リンク

アイキャッチ画像: Photo by Nathaniel Shuman on Unsplash