AI

TOPS:視覚トークン78%削減でMLLM性能を維持する第一原理的手法

視覚トークンの77.8%を削除しながらMLLM性能を100%維持するTOPS手法が公開されました。訓練不要・モデル非依存の設計で7モデル14ベンチマークで検証されており、マルチモーダルAIの推論コスト削減に直接活用できます。
AI

7BモデルがGUI操作で32Bを上回る:PEEU自律経験学習(ACL 2026)

7BパラメータのモデルがWebブラウザのGUI操作で32BモデルをPEEUフレームワークにより上回りました。ACL 2026採択のこの手法は自律的な環境探索で経験を生成し、ローカル実行による低コスト・プライバシー配慮の自動化エージェントを可能にします。
AI

Apple Vision Pro副社長がOpenAIへ:AI端末競争が次の段階へ

AppleのVision Pro開発を統括したポール・ミード副社長がOpenAIに転職します。ジョニー・アイブ氏主導のAIデバイス開発への参加が見込まれ、AI端末市場でのハードウェア人材争奪戦が激化しています。
AI

Sakana AIの「Fugu」登場、フロンティアモデルの空白を埋める

東京のSakana AIがフロンティアAIモデル「Fugu」を発表しました。AnthropicのMythos 5輸出規制で生じた供給空白に「輸出規制リスクなし」を売りに参入した形で、AIの地政学的競争が新局面を迎えています。
AI

トランプ政権、Anthropic Mythos 5 の輸出規制を部分解除

トランプ政権が6月26日、AnthropicのMythos 5とFable 5への輸出規制を部分解除しました。100社超の米国組織が使用可能となり、非米国籍従業員へのアクセスも認められています。
AI

LeanGuard:推論不要の安全ガードで従来比100倍高速

LLMの安全ガードにChain-of-Thought推論は不要だと示すLeanGuardが公開されました。395Mパラメータの軽量エンコーダが大型推論モデルと同等のF1スコア82.90を達成し、推論コストを約100分の1に削減してエッジデバイスへの展開も可能にします。
AI

Nemotron-TwoTower:拡散LMが品質維持で2.42倍高速化

Nvidiaの研究チームが、拡散言語モデルと自己回帰モデルを2塔構成で組み合わせるNemotron-TwoTowerを発表しました。品質は自己回帰ベースラインの98.7%を維持しながら生成スループットが2.42倍に向上し、コードとモデル重みはオープンソースで公開されています。
AI

LLM採用選考でプロンプト注入 — ACL 2026論文が警告

採用選考にLLMを使うシステムが、虚偽の経歴を加えなくても「自己推薦文の埋め込み」で操作できることをACL 2026採択論文が実証しました。注入手法を知る応募者が有利になる公平性の問題は、企業の法的リスクにも直結します。
AI

LLM組み合わせの天井:67モデル研究が示す根本的な限界

67の最前線LLMを横断した研究が、複数モデルを組み合わせても改善できない「共同失敗の天井」を実証しました。精度の上限は全モデルの同時失敗率βで決まり、モデル数を増やすだけでは解消しないことが示されています。
AI

Gemini Sparkが登場 — Googleが24/7常時稼働の個人AIエージェントを実装

GoogleがI/O 2026でGemini Sparkを発表しました。24時間バックグラウンドで稼働するAIエージェントが月間9億人のGeminiアプリに展開され、消費者向けAIの常時稼働時代が幕を開けます。