AIエージェント(自律的にタスクを実行するAIシステム)が知識労働にどれほどの変革をもたらすか、実際のプロダクトデータを使った研究が公開されました。How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope(arXiv:2606.07489)は、Perplexityの検索製品「Search」とエージェント製品「Computer」のセッションデータを比較分析したもので、Computerを使うとタスク完了時間が87%短縮し、コストは94%削減されるという実測値が報告されています。理論的な推計ではなく、実際のユーザー行動データに基づいた研究という点が信頼性の高い根拠を提供しています。
背景と文脈
AIエージェントが知識労働を変えるという議論は、大規模言語モデル(LLM)の普及以降急速に広まりました。しかし多くの主張がデモや理論的推計に頼っており、実際のプロダクト環境における大規模なユーザーデータに基づく研究は限られていました。特に問題だったのは、同じユーザーが同じタスクを従来型の検索とエージェントの両方で試みるような「公平な比較」が難しいという点です。
本研究はこの課題に対して、「自然実験」という手法で対処しています。検索製品SearchとエージェントComputerで、初期クエリがほぼ同一であるセッションを抽出し、製品の違いによる影響を統計的に分離しました。著者のJeremy Yang氏らはPerplexityに在籍しており、実際のプロダクトデータに直接アクセスできる立場から分析を行っています。AIエージェントが「本当に役に立つのか」という問いへの実証的な答えとして位置づけられる研究です。
技術/ビジネス面

数値は具体的で説得力があります。Computer(エージェント)のセッションあたりの自律作業時間は26分で、Search(検索)の33秒と比べて約47倍に達します。同一タスクでの比較では、タスク完了時間が269分から36分へと87%短縮され、Searchのみを使った人間と比べてコストも94%削減されました。ユーザーの不満足率はComputerの方がSearchより55%低く、速いだけでなく品質も向上していることが示されています。
変化は時間とコストにとどまりません。研究の重要な発見のひとつは「スコープの拡大」です。Computerを使うことで、ユーザーは従来は検索ではほぼ取り組まれなかった複合タスク—異なる職種にまたがる複数の業務を組み合わせた作業—にも挑戦できるようになりました。フォローアップのクエリ内容も変化しており、Searchでは追加情報を探す用途が多かったのに対し、Computerでは完成した成果物を「確認・拡張する」ための問いかけが増えています。エージェントが作業の主担当となり、人間はディレクション役に移行している様子が読み取れます。
これからどうなるか
この研究が示す数値は、AIエージェントを業務に組み込む検討をしている組織にとって無視できないものです。87%の時間短縮・94%のコスト削減が実際のユーザーデータで確認されたことは、ROI(投資対効果)試算の根拠として活用できます。現在ChatGPTやClaudeのエージェント機能を部分的に試している開発チームは、より本格的な自律タスク委任への移行コストと得られる効率化を再評価するタイミングかもしれません。
一方で課題も残ります。Perplexityのユーザーベースに限定されたデータであるため、業種や職種によって効果が異なる可能性があります。また、自律作業時間が長いほど人間による監視コストが増える点も考慮が必要です。エージェントに任せた作業の検証プロセスをどう設計するかが、次の実装課題となりそうです。
まとめ
Perplexityの研究者が実プロダクトデータを使い、AIエージェントがタスク完了時間を87%短縮・コストを94%削減することを実測しました。単なる推計ではなく自然実験による実証値であり、エージェント活用を検討している開発者・組織にとって具体的な判断材料となります。スコープの拡大という発見も重要で、検索では難しかった複合タスクへの対応可能性が示されています。
参考リンク
アイキャッチ画像: Photo by freddie marriage on Unsplash

