Human Archiveが$820万調達 — インドのギグワーカーがロボットを訓練

white robot technology future AI

UC BerkeleyとStanfordの研究者4名が設立したスタートアップ「Human Archive」が820万ドルを調達しました。同社は、インドのギグワーカーにカメラ付きキャップとセンサーデバイスを装着させ、日常業務の一人称視点映像データを収集しています。このデータをロボットやAIシステムの訓練用に販売するビジネスモデルで、「物理AI(Physical AI)」と呼ばれる、現実世界で動作するロボット向け訓練データの不足を解消しようとしています。

背景と文脈

ChatGPTのような言語モデルと異なり、現実の物体を掴んだり歩き回ったりするロボットには、リアルワールドでの動作映像が大量に必要です。NvidiaのIsaac LabやFigureのような人型ロボット開発企業は、人間の動きと感覚データを収集した「物理AI向け訓練データ」の調達に頭を抱えています。

既存の手法は主に合成データ(シミュレーション環境で生成した仮想データ)に頼るか、高コストな動作キャプチャースタジオを使うものでした。しかし合成データは現実との「ドメインギャップ」(シミュレーションと現実の乖離)が大きく、実際のロボット動作に十分役立たない場合があります。Human Archiveは「実際の人間が実際の環境でどう動くか」というリアルデータを大規模に集める点で、この課題への別解を提示しています。

共同創業者のSamay Maini氏らは、インドのサービス業スタートアップと提携して労働者を確保するというアプローチを取っています。投資家にはWing Venture Capital、NVP Capital、Y Combinator、さらにOpenAI・Nvidia・Google・MetaのエンジェルというAI業界の主要プレイヤーが名を連ねています。

技術/ビジネス面

group of women walking on a dirt road
Photo by Annie Spratt on Unsplash

Human Archiveのシステムは、カメラ付きキャップ・触覚手袋・全身モーションキャプチャースーツ・リストカメラなど50種類以上のデバイスを組み合わせ、複数センサーのデータを同期して収集します。現在1,000台以上のヘッドセットが複数拠点に展開済みです。

労働者への報酬は時給1ドルで、競合他社の2.63〜4.20ドルと比べると低水準です。インドの物価水準を考慮しても、この点は倫理的議論の余地があります。同社は現在インド国内の複数都市で展開しており、東南アジアと米国への拡大も計画しています。

ビジネスモデルとしては、収集データをロボット開発企業やAIラボに販売する形です。Scale AIやAnnotation AIなどのデータラベリング企業が大きくなったように、物理AI向けデータ収集という新しい市場でのポジション確立を狙っています。

これからどうなるか

物理AIの市場が拡大するにつれ、訓練データの需要も急増します。NvidiaはCESでPhysical AIへの注力を宣言しており、人型ロボットの開発競争は2026年に入っても加速しています。Human Archiveが参入するデータ収集ビジネスは、ソフトウェアのAIとは異なるレイヤーで大きな市場になる可能性があります。

ただし課題もあります。1,000台規模から数万台・数十万台へのスケールは容易ではなく、データ品質の均一化や労働者管理の複雑さが壁になります。また低賃金労働の倫理問題がメディアで取り上げられれば、評判リスクにもなり得ます。ロボット開発に取り組む企業にとっては、このような外部データサプライヤーの動向を追うことで、訓練データ調達のコスト構造と選択肢を把握しておく価値があります。

まとめ

Human Archiveはインドのギグワーカーを使い物理AI向けリアルデータを収集するスタートアップです。820万ドル調達でデータ収集インフラを拡張しており、ロボット訓練データ市場の新興プレイヤーとして注目されます。

参考リンク

アイキャッチ画像: Photo by Mathew Schwartz on Unsplash

タイトルとURLをコピーしました