XDOF、7000万ドル調達 — ロボット訓練データの専門企業が始動

robot arm manufacturing engineering AI

ロボットAIの訓練データ収集を専業とするスタートアップXDOFがステルスを解除しました。Thrive Capital、Spark Capital、a16z、Lux Capital、WndrCoから総額7000万ドルを調達し、フィジカルAI(物理空間で動作するAI)向けのデータインフラ企業として本格始動します。テキストデータが大規模言語モデルの発展を支えたのと同様に、物理的な操作データがロボット工学の次のボトルネックになるという問題意識が出発点です。

背景と文脈

LLM(Large Language Model、大規模言語モデル)の急速な発展を支えたのはインターネット上の膨大なテキストデータでした。テキストは比較的容易に収集・加工できるため、研究機関・企業がスクレイピングやクロールで大規模データセットを構築できました。しかしロボットを動かすための「動作データ」は事情が異なります。センサー・カメラ・制御システムを持つ実機を使って人間が操作しながら記録する必要があり、デジタルのみでは完結しません。

テレオペレーション(Teleoperation:人間が遠隔から実機ロボットを操作して訓練データを収集する手法)は有望なアプローチですが、規模化が難しいとされてきました。実機の保守・キャリブレーション・オペレーターの訓練など、運用コストが高いからです。「フロンティアAIラボの全部がロボット工学を追っているが、そのためのデータ収集基盤を持つ企業がほとんどない」という空白を狙ったのがXDOFです。

同社は2024年10月に設立されました。Philipp Wu(CEO)、Fred Shentu(CTO)、Nemo Jin(COO)の3人が創業し、従業員は現在約60名です。既に20社の顧客を持ち、「複数のフロンティアAIラボ」を含むとしています(名称は非公開)。

技術/ビジネス面

physical labor training field
Photo by Javad Esmaeili on Unsplash

XDOFのデータ収集は3層で構成されています。第1層は実際に稼働しているロボットからのテレオペレーションデータ。第2層はGELLO(低コストで組み立て可能な遠隔制御デバイス)を使った汎用テレオペレーションデータ。第3層は人間が日常動作を行いながら記録するエゴセントリックデータ(一人称視点での動作データ)です。この3層構造で、多様な動作パターンと環境条件をカバーします。

UC Berkeleyとの共同研究では、ABCデータセットを公開しました。13万件のロボット操作軌跡、シミュレーション300時間、評価用データ100時間を含む大規模なデータセットです。シャツの折り畳み、AirPodsケースへの収納など、精密な手先操作が必要な作業もカバーしています。

競合との差別化点は「データ収集を外部委託できる」仕組みを整えた点です。多くのAIラボが「数十万平方フィートの倉庫に数百台のロボットを置き、常に保守・キャリブレーション・オペレーター訓練を行う」ことを嫌います。XDOFはその運用負荷を肩代わりし、ラボはデータ仕様と予算だけ渡せば質の揃った訓練データを受け取れる形を提供しています。今後は「世界中でテレオペレーターとエゴセントリックデータ収集者を大規模に雇用・訓練する」計画も発表しています。

これからどうなるか

ロボット訓練データ市場は、かつてのデータアノテーション(画像へのラベル付けなど)産業と同様の構造になる可能性があります。AIラボがコアの研究・モデル開発に集中できる一方、データ収集という労働集約的な工程を専業企業に委託する分業体制です。XDOFの登場はその市場が成熟しつつあることを示しています。

開発者の視点では、フィジカルAI・ロボティクス開発に関わる場合、データ収集コストとパイプライン設計の見直しが選択肢に入ります。XDOFのようなデータプロバイダーをAPIや契約で利用できれば、自前でテレオペレーション設備を用意するより低コストでスタートできる可能性があります。ロボット向けモデルの実験段階でも、公開されているABCデータセットをベースラインとして活用できるでしょう。

課題は、データの品質管理と再現性です。異なる環境・オペレーターで収集されたデータの一貫性を保つことは難題で、ここが各社の技術差別化ポイントになります。また、ロボット動作データにはプライバシー(撮影場所・人物)や安全性(危険動作のデータを訓練に使わない)といった倫理的な考慮も必要で、業界標準が整備されるまでは各社の自主対応に委ねられています。

まとめ

XDOFは「ロボット訓練データのインフラ企業」として7000万ドルを調達し始動しました。テキストデータがLLM時代を支えたように、物理操作データがロボットAI時代の基盤になる—という仮説を事業化した最初期の専業企業として、ロボット工学の発展を支えるインフラの担い手になれるか注目されます。

参考リンク

アイキャッチ画像: Photo by ThisisEngineering on Unsplash

タイトルとURLをコピーしました