poko

AI

LLMが知識を持っていても幻覚する理由 — arXiv論文が新解明

arXivに公開された論文によると、LLMの幻覚(ハルシネーション)の16〜47%は、モデルがすでに正しい答えの確率を持っているにもかかわらず発生します。問題は知識の欠如ではなく、確率質量が複数の候補に分散する「コミットメント失敗」にあることが示されました。
AI

AIスタートアップのARR水増し問題 — VCが黙認する指標操作の実態

AIスタートアップのARR(年間経常収益)を実際より高く見せる指標操作がVC投資の現場で横行しています。契約済み未着手の売上をARRに混入させる手法やランレートの12倍換算など、業界全体に広がる実態をTechCrunchが報じました。
AI

DeepMind Co-Scientist — 多エージェントAIが科学仮説を自動生成・検証

Google DeepMindが科学仮説の生成・討論・洗練を多エージェントで自動化する「Co-Scientist」を公開しました。肝臓線維症の薬候補が実験で91%の抑制効果を示すなど6分野で成果があり、研究者向けにlabs.google/scienceで登録受付中です。
AI

MOSS公開 — AIエージェントが自分のソースコードを書き換えて自律進化

arXivに公開されたMOSSは、AIエージェントがプロンプトや設定ファイルではなく自身のソースコードを自律的に書き換えて性能を改善するフレームワークです。OpenClawベンチマークで平均スコアが0.25から0.61に向上し、ルーティングロジックなどの構造的課題を人間介入なしで修正できます。
AI

The Path、AIセラピーアプリで安全スコア95 — 元Calm創業者が発表

元CalmのAnson Whitmer氏らが立ち上げたAIセラピーアプリ「The Path」が、精神医療安全ベンチマークVera-MHで95点を達成しました。一般チャットボットの最高点65点を大きく上回り、オープンソースLLMをポストトレーニングして安全性を担保しています。
AI

TrumpがAIセキュリティ大統領令の署名を延期 — 事前共有条項が障壁に

トランプ大統領がAIモデルの商用公開前に政府への事前共有を義務づける大統領令の署名を延期しました。「中国との競争の妨げになる」と判断したためで、問題の条項は14〜90日前の政府共有義務です。EU AI Actとの対比が注目されます。
AI

Google、Gemini搭載AIメガネを公開 — Android XRで翻訳・ナビを実証

GoogleがGoogle I/O 2026でGemini AI搭載スマートグラス「Android XRメガネ」を初公開しました。Warby Parker・Samsungと共同開発し、リアルタイム翻訳・ナビ・AR表示をレンズ内に実現。音声モデルが2026年秋発売予定で、メタ・Snapとのウェアラブル競争が本格化します。
SQL

MySQLでEXPLAINを読む方法 — type列の意味を理解する

MySQLのEXPLAINが返す type・key・rows・Extra 各列の意味と読み方を、具体的なテーブルを使って解説します。type=ALL や Using filesort が出たときの改善策も紹介。MySQL 8.0 対応。
AI

AIがコックピット音声を復元、NTSBが調査記録を一時閉鎖

NTSBが、AIを使って調査書類のスペクトログラムから死亡パイロットの音声が復元・拡散されたとして、42件の調査記録を一時閉鎖しました。「変換済みデータは安全」という前提がAI技術の進化で崩れつつあることを示す事例です。
SQL

SQLのNULLと三値論理:IS NULL・COALESCEの使い分け

SQLでNULLが絡む比較・集計・JOINには独特の落とし穴があります。三値論理の基礎から、IS NULL・COALESCE・NULLIF・IFNULLの使い分けと集計時の注意点を、MySQL 8.0の実例で整理します。