研究・論文

AI

Grad Detect論文:LLM幻覚を勾配で検出——ICML2026

LLMの幻覚(ハルシネーション)を内部の勾配パターンで検出する手法「Grad Detect」がarXivに公開されました。最終5層の勾配だけで識別情報の97%を網羅し、11モデルで既存手法を上回る性能を示してICML 2026ワークショップに採択されています。
AI

能動的推論で物理AIの推論効率36%改善 — 新スケーリング則

物理AIエージェントに能動的推論(Active Inference)を適用しテスト時スケーリングを実現する論文が公開されました。自律走行タスクで推論効率を36%以上改善し、学習時未経験のシナリオへの汎化も達成しています。ロボティクス開発の設計選択肢が広がります。
AI

AgentCIBench論文:PC操作AIの67.9%が情報漏えい

コンピュータを自律操作するAIエージェント15モデルを評価したところ、11モデルが半数以上のシナリオで個人情報を意図せず漏えいし、平均漏えい率は67.9%に達しました。評価基準AgentCIBenchも公開され、展開前のプライバシー検証が不可欠と示しています。
AI

LLM誤整合を活性化ベクトルで99.6%検出 — 新手法

LLMをセキュリティ問題のあるコードでファインチューニングした際に生じる意図せぬ誤整合を、単一の活性化方向で99.6%の精度で検出できるとする論文が公開されました。モデル横断の転用は効果がなく、モデル内部監査が有効と示しています。
AI

Contagion Networks論文:マルチエージェントLLMで評価バイアスが伝染

マルチエージェントLLMシステムで評価者バイアスが伝染する現象を定量化したarXiv論文(2606.20493)が公開されました。バイアス伝播係数γは0.157〜0.352で、評価者を3者委員会にするだけで伝播が72.4%削減されると示しています。
AI

UltraQuant:4ビットKVキャッシュでエージェント推論を高速化

AMDチームのarXiv論文(2606.20474)がAIエージェントのKVキャッシュを4ビット圧縮するUltraQuantを発表しました。FP8比でP50初回応答時間を3.5倍短縮・出力スループットを1.6倍向上させており、長コンテキストの多ターンエージェントに特に効果的です。
AI

H-RePlan論文:デバイス横断エージェントの障害を階層的に回復

arXiv論文(2606.20487)がAndroidとLinuxをまたぐマルチデバイスAIエージェントの障害回復を階層化するH-RePlugフレームワークを提案しました。デバイス個別の回復とシステム全体の再計画を分離し、HeraBenchで完了率・命令遵守率の向上とコスト削減を実証しています。
AI

ORAgentBench論文:LLMエージェントが業務最適化で35%止まりの理由

LLMエージェントが業務最適化問題をどこまで解けるかを測るORAgentBenchが公開されました。107件の実務タスクに対する14エージェント構成の評価で最高スコアは35.51%、難問では20.59%にとどまり、業務ルール見落としや解の品質不足が主な失敗パターンとして明らかになっています。
AI

CEO-Bench発表 — AIエージェントは長期経営判断が苦手

スタートアップ経営500日間をシミュレートするエージェント評価基準CEO-Benchが公開されました。Claude Opus 4.8とGPT-5.5だけが初期資金を維持できた一方、安定した黒字化を達成できたモデルは皆無で、長期戦略判断の難しさが示されています。
AI

STATEWITNESS論文:LLM欺瞞をAUROC 0.916で検出

LLMが欺瞞的な応答を生成するリスクを活性化ベクトルから説明付きで検出するSTATEWITNESSが公開されました。既存最良手法と比べてAUROC 11.6%向上し、トークンレベルの根拠トレースで監査コスト削減にも貢献します。