AI

Gemini 3.5 Live Translate — 70言語対応のリアルタイム音声翻訳が登場

Googleが70言語以上に対応するリアルタイム音声翻訳「Gemini 3.5 Live Translate」を公開しました。話者の発話中に並行して翻訳を生成し、声のイントネーションも保持します。Google AI StudioでAPIとして提供され、多言語対応サービスへの組み込みが可能です。
AI

正解データなしでLLMをRL改善するRiVERフレームワーク

正解ラベルなしのスコアベースタスクでLLMを強化学習するRiVERフレームワークがarXivで公開されました。AtCoderで訓練したモデルがALE評価で8〜9%向上し、さらに正解が必要な他ベンチマークでも2〜3.5%の性能改善が転移しています。
AI

LLMエージェントループを意味的に早期停止、トークン38%削減

複数LLMエージェントの反復ループで、埋め込みのコサイン距離を使い収束点を自動検出して早期停止する手法がarXivで公開されました。HotpotQAの実験でトークン消費を38%削減しており、オープンソース実装でRAGやコード生成パイプラインへの応用が可能です。
AI

MicronがAIメモリ特需で株価236%高 — ウォール街が「次のNvidia」と評価

MicronがAI需要を追い風に第3四半期売上を前年比4倍の414.5億ドルに伸ばし、株価が過去1か月で236%上昇しました。NvidiaやAnthropicなど16社との長期供給契約でサイクルリスクを緩和しており、ウォール街が「次のNvidia」と評価しています。
AI

DiffusionGemma公開 — Googleの拡散テキスト生成が4倍高速化

Googleが実験的オープンモデル「DiffusionGemma」を公開しました。256トークン並列処理で従来比最大4倍の生成速度を達成し、Apache 2.0ライセンスで商用利用も可能。VRAM 18GBの民生GPUでも動作します。
AI

TOPS:視覚トークン78%削減でMLLM性能を維持する第一原理的手法

視覚トークンの77.8%を削除しながらMLLM性能を100%維持するTOPS手法が公開されました。訓練不要・モデル非依存の設計で7モデル14ベンチマークで検証されており、マルチモーダルAIの推論コスト削減に直接活用できます。
AI

7BモデルがGUI操作で32Bを上回る:PEEU自律経験学習(ACL 2026)

7BパラメータのモデルがWebブラウザのGUI操作で32BモデルをPEEUフレームワークにより上回りました。ACL 2026採択のこの手法は自律的な環境探索で経験を生成し、ローカル実行による低コスト・プライバシー配慮の自動化エージェントを可能にします。
AI

Apple Vision Pro副社長がOpenAIへ:AI端末競争が次の段階へ

AppleのVision Pro開発を統括したポール・ミード副社長がOpenAIに転職します。ジョニー・アイブ氏主導のAIデバイス開発への参加が見込まれ、AI端末市場でのハードウェア人材争奪戦が激化しています。
AI

Sakana AIの「Fugu」登場、フロンティアモデルの空白を埋める

東京のSakana AIがフロンティアAIモデル「Fugu」を発表しました。AnthropicのMythos 5輸出規制で生じた供給空白に「輸出規制リスクなし」を売りに参入した形で、AIの地政学的競争が新局面を迎えています。
AI

トランプ政権、Anthropic Mythos 5 の輸出規制を部分解除

トランプ政権が6月26日、AnthropicのMythos 5とFable 5への輸出規制を部分解除しました。100社超の米国組織が使用可能となり、非米国籍従業員へのアクセスも認められています。