AI

AI

LLMが知識を持っていても幻覚する理由 — arXiv論文が新解明

arXivに公開された論文によると、LLMの幻覚(ハルシネーション)の16〜47%は、モデルがすでに正しい答えの確率を持っているにもかかわらず発生します。問題は知識の欠如ではなく、確率質量が複数の候補に分散する「コミットメント失敗」にあることが示されました。
AI

AIスタートアップのARR水増し問題 — VCが黙認する指標操作の実態

AIスタートアップのARR(年間経常収益)を実際より高く見せる指標操作がVC投資の現場で横行しています。契約済み未着手の売上をARRに混入させる手法やランレートの12倍換算など、業界全体に広がる実態をTechCrunchが報じました。
AI

DeepMind Co-Scientist — 多エージェントAIが科学仮説を自動生成・検証

Google DeepMindが科学仮説の生成・討論・洗練を多エージェントで自動化する「Co-Scientist」を公開しました。肝臓線維症の薬候補が実験で91%の抑制効果を示すなど6分野で成果があり、研究者向けにlabs.google/scienceで登録受付中です。
AI

MOSS公開 — AIエージェントが自分のソースコードを書き換えて自律進化

arXivに公開されたMOSSは、AIエージェントがプロンプトや設定ファイルではなく自身のソースコードを自律的に書き換えて性能を改善するフレームワークです。OpenClawベンチマークで平均スコアが0.25から0.61に向上し、ルーティングロジックなどの構造的課題を人間介入なしで修正できます。
AI

The Path、AIセラピーアプリで安全スコア95 — 元Calm創業者が発表

元CalmのAnson Whitmer氏らが立ち上げたAIセラピーアプリ「The Path」が、精神医療安全ベンチマークVera-MHで95点を達成しました。一般チャットボットの最高点65点を大きく上回り、オープンソースLLMをポストトレーニングして安全性を担保しています。
AI

TrumpがAIセキュリティ大統領令の署名を延期 — 事前共有条項が障壁に

トランプ大統領がAIモデルの商用公開前に政府への事前共有を義務づける大統領令の署名を延期しました。「中国との競争の妨げになる」と判断したためで、問題の条項は14〜90日前の政府共有義務です。EU AI Actとの対比が注目されます。
AI

Google、Gemini搭載AIメガネを公開 — Android XRで翻訳・ナビを実証

GoogleがGoogle I/O 2026でGemini AI搭載スマートグラス「Android XRメガネ」を初公開しました。Warby Parker・Samsungと共同開発し、リアルタイム翻訳・ナビ・AR表示をレンズ内に実現。音声モデルが2026年秋発売予定で、メタ・Snapとのウェアラブル競争が本格化します。
AI

AIがコックピット音声を復元、NTSBが調査記録を一時閉鎖

NTSBが、AIを使って調査書類のスペクトログラムから死亡パイロットの音声が復元・拡散されたとして、42件の調査記録を一時閉鎖しました。「変換済みデータは安全」という前提がAI技術の進化で崩れつつあることを示す事例です。
AI

Hark、$700M Series AでBrett AdcockがユニバーサルAI開発へ

Brett Adcock氏のAIスタートアップHarkが7億ドルのシリーズAを調達し、評価額60億ドルに達しました。個人用AI専用モデルと専用ハードウェアの開発を目指しており、今夏のマルチモーダルモデル公開と専用デバイス展開を予告しています。
AI

NvidiaのVera CPUがAIエージェント向け$2000億市場を開拓 — Jensen Huang宣言

NvidiaのCEOジェンスン・フアン氏が、AIエージェント専用CPU「Vera」によって2000億ドル規模の新市場を開拓できると宣言しました。同四半期の初期販売は200億ドル超で、エージェントの普及が従来のGPU需要とは別軸のCPU市場を生み出すという新たな成長シナリオが示されています。