Thinking Machines Lab、全二重AIを公開 — 応答0.4秒でGPT超え

yellow and black pendant lamp AI

元 OpenAI CTO の Mira Murati 氏が創業したスタートアップ Thinking Machines Lab が、2026年5月13日頃、「インタラクションモデル(interaction models)」と呼ぶ新しい AI アーキテクチャの研究プレビューを公開しました。音声・映像・テキストを単一ネットワークで同時処理する全二重(full-duplex:送受信を同時に行う通信方式)設計を採用し、ターン待ちレイテンシ 0.4 秒という人間の自然な会話速度を達成しています。AI 音声対話の評価指標 FD-bench v1.5 では OpenAI の GPT-realtime-2.0 に対して大幅に高いスコアを記録しており、現行の音声 AI アーキテクチャへの根本的な問い直しを迫る発表として業界の注目を集めています。

背景と文脈

現在の AI 音声対話システムの多くは、音声認識(ASR:Automatic Speech Recognition)→ LLM → 音声合成(TTS:Text-to-Speech)という三段階を組み合わせた設計です。それぞれのコンポーネントは独立して最適化されており、全体の応答速度はこれらのレイテンシを積み上げた値になります。また、発話のターン管理は別途 VAD(Voice Activity Detection:音声区間検出、マイク入力のどの部分に声が入っているかを判定するモジュール)に依存することが多く、「AI が話しているときにユーザーが割り込もうとすると無視される」「沈黙が長いと誤ってターンを終わったと判定される」といった問題が生じやすい構造です。

Thinking Machines Lab は 2024 年秋に Murati 氏が OpenAI を退社後に設立し、2025 年中頃に 20 億ドルの資金調達を完了しています。詳細が明らかでなかった同社の研究方向が今回初めて具体的に示された形です。

技術/ビジネス面

black corded telephone
Photo by Quino Al on Unsplash

「インタラクションモデル」の核心は、「聴く・話す・見る・適切なタイミングで止まる」という能力をすべて一つのネットワークで学習させる点にあります。コンポーネントを外からつなぎ合わせるのではなく、これらの能力が一体として焼き込まれているため、レイテンシの積み上げが発生しません。

実装上は 2 つのモデルに分割されています。一つはユーザーとリアルタイムで対話し続ける「インタラクションモデル本体」、もう一つは推論やツール呼び出しを非同期で担う「バックグラウンドモデル」です。200 ミリ秒のマイクロターン交代を採用することで、会話が途切れない体験を実現しています。

性能面では FD-bench v1.5 においてTML-Interaction-Small モデルが 77.8 点を記録。比較として Gemini が 54.3 点、GPT-realtime-2.0 が 47.8 点とされており、差は顕著です(ただし Thinking Machines Lab 自身が評価を実施している点は割り引いて見る必要があります)。ターン待ちレイテンシの 0.4 秒は、人間同士の自然な会話でのターン交代(平均 200〜300 ミリ秒程度)には届かないものの、現行の AI 音声システムと比べると大幅な改善です。

これからどうなるか

現在は限定的な研究プレビューとして公開されており、一般向けの広範な利用は 2026 年後半を予定しています。Thinking Machines Lab は OpenAI の Realtime API の代替になりえる位置づけを目指しているとも示唆しており、成功すればリアルタイム音声 AI の競争軸が変わる可能性があります。

開発者の観点では、音声エージェントや会話型インターフェースを構築している場合、現行の ASR+LLM+TTS の三段構成が主流である間に、このようなエンドツーエンドの全二重アーキテクチャが選択肢に加わることになります。Realtime API を使った音声インターフェースを実装済みであれば、Thinking Machines Lab の正式リリース後に品質・コスト・統合のしやすさを比較検討する価値があります。

まとめ

Thinking Machines Lab は「インタラクションモデル」という全二重の音声・映像対話 AI アーキテクチャを発表しました。0.4 秒の応答速度と GPT-realtime-2.0 を大幅に上回るスコアは、現行の接続型アーキテクチャへの挑戦状ともいえます。

参考リンク

アイキャッチ画像: Photo by Harold Jonker on Unsplash

タイトルとURLをコピーしました