AI

LeanGuard:推論不要の安全ガードで従来比100倍高速

LLMの安全ガードにChain-of-Thought推論は不要だと示すLeanGuardが公開されました。395Mパラメータの軽量エンコーダが大型推論モデルと同等のF1スコア82.90を達成し、推論コストを約100分の1に削減してエッジデバイスへの展開も可能にします。
AI

Nemotron-TwoTower:拡散LMが品質維持で2.42倍高速化

Nvidiaの研究チームが、拡散言語モデルと自己回帰モデルを2塔構成で組み合わせるNemotron-TwoTowerを発表しました。品質は自己回帰ベースラインの98.7%を維持しながら生成スループットが2.42倍に向上し、コードとモデル重みはオープンソースで公開されています。
AI

LLM採用選考でプロンプト注入 — ACL 2026論文が警告

採用選考にLLMを使うシステムが、虚偽の経歴を加えなくても「自己推薦文の埋め込み」で操作できることをACL 2026採択論文が実証しました。注入手法を知る応募者が有利になる公平性の問題は、企業の法的リスクにも直結します。
AI

LLM組み合わせの天井:67モデル研究が示す根本的な限界

67の最前線LLMを横断した研究が、複数モデルを組み合わせても改善できない「共同失敗の天井」を実証しました。精度の上限は全モデルの同時失敗率βで決まり、モデル数を増やすだけでは解消しないことが示されています。
AI

Gemini Sparkが登場 — Googleが24/7常時稼働の個人AIエージェントを実装

GoogleがI/O 2026でGemini Sparkを発表しました。24時間バックグラウンドで稼働するAIエージェントが月間9億人のGeminiアプリに展開され、消費者向けAIの常時稼働時代が幕を開けます。
AI

AI自律処方が合法化へ — 医師の拒否権論文が示す安全設計

米国でAIが自律的に医薬品を処方することを認める法案と州パイロットが動き始めました。arXiv論文「The Clinician's Veto」は136人の医師調査をもとに、安全な自律処方に必要な3つの設計要件を示しています。
AI

Unconventional AI、1000倍省電力の推論チップ開発

元DatabricksのAI責任者が創業したUnconventional AIが、現行の1/1000の消費電力を目指す発振器ベース推論チップを開発中です。初の生成AIモデルUn0を公開し、AIのエネルギー問題に正面から挑んでいます。
AI

AdobeがTopaz Labsを買収 — 動画・画像AI強化へ

AdobeがAI画像・動画強化のTopaz Labsを買収しました。Emmy賞受賞の動画アップスケーリング「Astra」がFireflyとCreative Cloudに統合され、コンシューマー向けGPUで大規模映像処理が可能になります。
AI

Gemini 3.5 Flashがコンピュータ操作機能を統合

GoogleがGemini 3.5 Flashにコンピュータ操作機能をネイティブ統合し、6月24日にAPIで提供を開始しました。ブラウザ・モバイル・デスクトップを横断した長時間自動化が可能で、プロンプトインジェクション対策も組み込まれています。
AI

量子化でLLMの推論コストが増大 — 精度維持でも費用増

量子化でコスト削減を図っても、推論型LLMでは連鎖思考のトークンが膨張して費用が増すケースがあることをarXiv論文が示しました。精度だけでなくトークン消費量を実測してコスト評価に組み込む必要があります。