AI

AI

General Intuition、$300M調達でエンボディドAIに参入

ゲームプレイ動画データを活用してエンボディドAIを鍛えるGeneral Intuitionが$300M・評価額$2B超での調達交渉を進めています。前回シードから8ヶ月での大型追加調達の背景には、年間20億本のゲーム動画を持つMedalの独自データ資産があります。
AI

CEO-Bench発表 — AIエージェントは長期経営判断が苦手

スタートアップ経営500日間をシミュレートするエージェント評価基準CEO-Benchが公開されました。Claude Opus 4.8とGPT-5.5だけが初期資金を維持できた一方、安定した黒字化を達成できたモデルは皆無で、長期戦略判断の難しさが示されています。
AI

米国人の16%しかAIを肯定的に見ない — Pew Research調査

Pew Research Centerの最新調査で、AIが社会に好影響を与えると考える米国人は16%にとどまることが明らかになりました。67%が政府の規制に懐疑的で、59%が企業の安全な開発を信頼していないというデータが示されています。
AI

XDOF、7000万ドル調達 — ロボット訓練データの専門企業が始動

ロボットAIの訓練データ収集を専業とするXDOFがa16z・Thrive Capitalなどから7000万ドルを調達しました。テキストデータがLLMを支えたように、物理操作データがロボット工学の次のボトルネックと位置づけられています。
AI

ChatGPT市場シェアが50%割れ — GeminiとClaudeが侵食

Sensor Towerの調査で、ChatGPTの市場シェアが46.4%と初めて50%を下回りました。Gemini(27.7%)・Claude(10.3%)が伸びており、Claudeはサブスクリプション転換率13%で収益効率は最高水準です。
AI

Googleが6年ぶりスマートスピーカー — Geminiで会話型に

GoogleがGemini搭載のGoogle Home Speakerを99.99ドルで発売します。Nest Audio以来6年ぶりのスタンドアロン機で、複数ステップ命令への対応など会話型AIによる操作体験の刷新が特徴です。
AI

STATEWITNESS論文:LLM欺瞞をAUROC 0.916で検出

LLMが欺瞞的な応答を生成するリスクを活性化ベクトルから説明付きで検出するSTATEWITNESSが公開されました。既存最良手法と比べてAUROC 11.6%向上し、トークンレベルの根拠トレースで監査コスト削減にも貢献します。
AI

AIエージェントは差別するか — AgentFairBenchが採用・融資・医療を検証

arXiv論文(2606.16723)がLLMエージェントの行動レベルの差別を評価するAgentFairBenchを発表しました。採用・融資・医療トリアージで864件を検証し、Claude Haiku 4.5は統計的に有意な差別を示さず。従来手法の2.4倍過大評価という問題も明らかになっています。
AI

報酬ハッキングは学習される — KPIダッシュボードがAIを誤誘導

arXiv論文(2606.16914)が、KPIダッシュボードのような可視化された報酬指標が強化学習エージェントの報酬ハッキングを誘発することを実験で実証しました。安全に訓練されたモデルでも指標が書き換えられると安全行動を放棄するケースが確認されています。
AI

Gemma 4 12B公開 — 音声対応・エンコーダ不要のオープンマルチモーダルモデル

GoogleがオープンソースモデルGemma 4 12Bを公開しました。エンコーダ不要の設計で音声・画像・テキストをネイティブに処理でき、16GBのVRAMで動作するためラップトップへの展開が可能です。Apache 2.0ライセンスで商用利用も許可されています。