MOSS公開 — AIエージェントが自分のソースコードを書き換えて自律進化

arXivに公開された論文「MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems」は、AIエージェント（自律的に目標を設定し外部ツールを使って作業を完了するAIシステム）が自身のソースコードを書き換えることで性能を向上させるフレームワークを提案しています。既存の自己改善研究はプロンプトや設定ファイルの変更にとどまっていましたが、MOSSはルーティングロジックや状態管理などのコードアーキテクチャそのものを修正する点が新しいです。OpenClaw（エージェントの実タスク遂行能力を評価するベンチマーク）では、単一の自律サイクルで平均スコアが0.25から0.61に向上しました。

背景と文脈
技術/ビジネス面
これからどうなるか
まとめ
参考リンク

背景と文脈

AIエージェントの実用化が進む中、デプロイ後の継続的な改善が課題になっています。現在の主流アプローチは、エージェントが自分のプロンプト（指示文）やワークフロー定義を書き換える「テキスト可変層」での自己修正です。システムプロンプトの最適化・ツール呼び出し手順の変更・エラーメッセージの改善などは行えますが、コードの構造的問題（ルーティングの設計ミス・状態管理のバグ・制御フローの非効率）には対応できません。

ソフトウェアエンジニアリングで例えると、「設定ファイルは調整できるが、コードのリファクタリングはできない」状態です。利用中に発見されたバグが設定変更だけでは直せないアーキテクチャに起因している場合、従来の自己修正フレームワークでは限界があります。MOSSはこのギャップを埋めることを目的としており、「テキスト可変層はチューリング完全ではなく、ソースコード書き換えはその厳密なスーパーセットだ」と論文は主張しています。

技術/ビジネス面

black laptop computer displaying source code — Photo by Jantine Doornbos on Unsplash

MOSSの動作パイプラインは4段階です。まず本番環境での失敗事例を自動収集してバッチ化します。次に外部コーディングエージェント（コード生成に特化したAI）がコードの修正案を作成します。その後、仮想環境で失敗ケースを再現し、修正後のコードで問題が解消されるかを検証します。最後にユーザーの同意を経てコンテナスワップ（稼働中の環境を新バージョンに切り替える手法）で本番反映し、問題が出れば自動ロールバックします。

重要な特徴は「決定論的（deterministic）」な動作です。外部コーディングエージェントは交換可能なプラグインとして扱われ、MOSS自体はステージの順序制御と検証に専念します。ベースモデルの挙動への依存を減らし、予測可能な自己修正プロセスを実現しています。OpenClawベンチマークでの平均スコア0.25→0.61という改善は人間の介入なしで達成されており、エージェントのセルフサービス運用に向けた可能性を示しています。

これからどうなるか

自己修正できるエージェントは、長期稼働・高信頼性が求められるユースケース（自動化されたデータ処理・コンプライアンス監視・カスタマーサポート）で特に価値を発揮しそうです。本番運用しながら自律的に改善を続けるエージェントは運用コストを下げる一方で、想定外の方向への変化というリスクも孕みます。

開発者の視点では、自社プロジェクトにMOSSのアプローチを取り入れる場合、コード変更のスコープを安全な範囲に限定するガードレールの設計が不可欠です。どこまでをエージェントが自律判断し、どこから人間のレビューを必要とするかの境界設定が実装上のキーポイントになります。エージェントのCI/CD（継続的インテグレーション・デリバリー：コードの変更を自動でテスト・デプロイする仕組み）パイプラインに自己修正ループを組み込む実験的な活用が今後増えると見られます。