ゲームプレイ動画データを活用して「エンボディドAI(embodied AI:身体を持つかのように空間・物理環境を理解するAIシステム)」を鍛える米スタートアップ、General Intuitionが$300M(約450億円)の資金調達交渉を進めていることが明らかになりました。評価額は$2Bを超える見込みで、投資家にはJeff Bezos氏、Eric Schmidt氏、Khosla Ventures、General Catalystなどが名を連ねています。同社の前回調達はわずか8ヶ月前の$134Mシード。急速な評価額上昇の背景には、ゲームプレイ動画を年間20億本提供するMedalプラットフォームという独自のデータ資産があります。
背景と文脈
エンボディドAIは、テキスト生成や画像生成とは異なるカテゴリの技術的難題です。言語モデルは大量のテキストデータから学べますが、「手でボールを掴む」「ドアを開けながら荷物を持ち込む」といった空間・物理的な行動の理解には、それに対応した訓練データが必要になります。映像・動作・結果が紐付いた大規模データセットの確保が、エンボディドAI開発の最大のボトルネックとされてきました。
この課題を解決する独自のデータ源として注目されているのが、ゲームプレイ動画です。特に一人称視点のゲームは、人間が「環境を見て・判断して・操作する」プロセスをリアルタイムで記録しています。General Intuitionの親会社Medal.tvは、月間アクティブユーザー1000万人が生成する年間20億本のゲームプレイ動画を保有しており、この独自データ資産が同社の競争優位の核心です。OpenAIがMedalの買収に動いたとも伝えられており、他の大手AIラボも獲得を打診したとされています。
世界モデル(world model:環境が行動に応じてどう変化するかを予測するAIモデル)の開発では、Runway・Decart・Fei-Fei Li率いるWorld Labsなどが競っています。これらが主に映像生成向けに世界モデルを商品化しているのに対し、General Intuitionは世界モデルをあくまで「エージェント訓練ツール」として位置づけ、訓練されたエージェント自体を製品とする点で差別化を図っています。
技術/ビジネス面

General Intuitionの技術アプローチの核心は、ゲームプレイデータを使って空間的・時間的な推論能力(spatial-temporal reasoning)を世界モデルに学習させることにあります。エージェントはMedalの動画データを通じて「見る→予測する→行動する」サイクルを反復学習し、未見の環境でも適応的に動作できる汎化能力の獲得を目指します。世界モデルは直接販売せず、あくまで訓練基盤として活用するという設計が特徴的です。
創業チームはPim de Witte(Medalの共同創業者)、Eloi Alonso、Adam Jelley、Vincent Micheliで構成されており、世界モデルと強化学習の研究で実績を持つ顔ぶれです。前回調達$134Mからわずか8ヶ月での$300M追加調達は、業界でも異例の速さといえます。資金の用途としてde Witte氏はコンピューティングリソースの大規模拡張を挙げており、夏から秋にかけての新製品リリースに向けた計算基盤の整備を急いでいます。
ゲームデータに着目した理由はデータの質と量にあります。プロゲーマーの動きはノイズが少なく、行動と結果の対応が明確で、かつ多種多様なシナリオを大量にカバーしています。従来のロボティクス研究では実機を動かすコストと危険性からデータ収集が難しく、ここに大きな非対称性が生まれています。GoogleはGenie 3にGoogleマップデータを統合するなど、各社が独自データ資産を武器に世界モデルの質を競っています。
これからどうなるか
General Intuitionは「夏〜秋に新製品リリース予定」としており、Medalデータで訓練されたエージェントが開発者向けAPIとして提供される可能性があります。もし空間推論エージェントがAPIで利用可能になれば、ロボット制御・VR環境設計・製造ライン自動化などの開発で新たな選択肢が加わります。現状、高品質な身体的推論モデルは自前で訓練するしかなく、そのコストと必要なデータ量はどちらも参入障壁が高い状態です。外部APIでこの能力を利用できるようになる意義は、開発者にとって大きいでしょう。
一方で、OpenAIをはじめとする大手ラボが同様のゲームデータ取得に動くリスクもあり、Medalが持つ独占的なデータ地位をどう守るかが今後の課題です。年間20億本のゲームプレイ動画が継続的に更新されていくという点は強みですが、競合が類似データを取得・生成し始めた場合には差別化の根拠が変わってきます。2026年後半にどのようなプロダクトが登場するかが、この分野全体の方向性を占う試金石になりそうです。
まとめ
General Intuitionは年間20億本のゲームプレイ動画という独自データ資産を武器に、エンボディドAIのエージェント訓練に特化した企業として急成長しています。$300M追加調達と$2B超の評価額が示す通り、世界モデル×エージェント訓練の市場は投資家から高い期待を集めており、夏秋のプロダクトリリースに注目が集まっています。
参考リンク
アイキャッチ画像: Photo by ThisisEngineering on Unsplash

