AGI(Artificial General Intelligence、人間と同等以上の汎用的な知的能力を持つAI)という概念の次に、AI業界で「RSI(Recursive Self-Improvement、再帰的自己改善)」が新たなキーワードとして浮上しています。TechCrunchが5月28日に公開した分析記事は、RSIをめぐる業界の議論と現実の進捗のギャップに切り込みました。RSIとは、AIシステムが人間の介入なしに自分自身を継続的にアップグレードし続ける仕組みのことです。理論上は閉じたループが成立すれば能力が指数関数的に向上する可能性があり、AI安全性の観点でも注目されています。
背景と文脈
RSIの概念はAI研究の文脈で古くから議論されてきましたが、LLM(Large Language Model、大規模言語モデル)の能力が急伸した2020年代中盤から、現実的な議論として浮上してきました。AGIが「人間レベルの汎用知性への到達点」を指していたのに対し、RSIはその先にある「AIが自律的に能力を高め続けるプロセス」を指します。どちらも定義が曖昧で人によって解釈が異なる点も共通しています。
現状のLLMはコードを書き、研究論文を要約し、実験計画を立案する能力を持ちます。「AIが研究を行う」ことはRSIへの第一歩でしょうか。Georgetownのヘレン・トナー氏はこれを明確に否定します。AIを研究に利用することと真のRSIは異なり、「真のRSIには人間の関与をゼロにすることが必要だ」と指摘します。現時点のシステムは依然として人間の指示・監視・判断に依存しており、RSIとは呼べないという立場です。
Googleのサンダー・ピチャイCEOも「確かに進歩しているが、まだそこには到達していない」と認めています。世界最大のAI企業の経営者でさえ慎重な見通しを持つ領域です。
技術/ビジネス面

RSIへの道を探る具体的なアプローチとして注目されているのが「エージェントスワーム(agent swarms、複数のAIエージェントが協調して動作する群れ構造)」です。Andrej Karpathyらの研究者は、エージェントの群れを使ってLLMをより小さなタスクで訓練するアプローチに取り組んでいます。AI同士が互いを訓練するという考え方の実践例です。
現時点の評価では、AIは研究を独立して遂行できる段階(「adequacy」)に近づきつつあるとみる研究者もいます。ただし「人間より効率が低い状態での独立」という条件付きで、真の自己改善ループには至っていません。RSIが成立するには「自己方向性(self-direction)」の実現が必須です。AIが目標の設定・進捗の評価・改善方針の決定を全て自律的にこなせることを指し、現行の最先端モデルでもこの条件を満たしていません。
ビジネスサイドでは、RSIを明示的な目標に掲げるスタートアップが複数登場しています。彼らへの資金流入が、理論的な議論を産業界の現実の動向へと押し上げている状況です。
これからどうなるか
RSIが現実になった場合の影響は極めて広範です。AIが能力を自律的に向上させるようになれば、人間が設計した安全機構の有効性が根本から問い直されます。AI安全性の研究機関がRSIを優先テーマに掲げているのもこの理由からです。
開発者視点では、現状でも「AIにコードを書かせてそのコードでモデルを改善するパイプライン」はすでに実験的に構築されています。CI/CDに組み込んだAIが自動でモデルの評価・選択を行う仕組みは、小規模なRSIの萌芽とも言えます。AIが自己改善するかどうかではなく、「AIを使った改善のループをどこまで自動化するか」が当面の実務的な問いです。RSIの議論を参照することで、自社パイプラインの設計について長期的な視野を持てるでしょう。
まとめ
AGIに続くAI業界の焦点として「RSI(再帰的自己改善)」への関心が高まっています。定義の曖昧さはAGIと同様で、真のRSIには人間関与のゼロ化が必要ですが、現状はそこに至っていません。エージェントスワームを活用した研究の進展やRSI志向のスタートアップ参入で、理論から現実への移行が着実に進んでいます。開発者にとっても、AIを使った改善ループの自動化という形でRSIの議論は実務に直結しそうです。
参考リンク
アイキャッチ画像: Photo by Eric Krull on Unsplash
