AI

AI

Gemma 4 12B公開 — 音声対応・エンコーダ不要のオープンマルチモーダルモデル

GoogleがオープンソースモデルGemma 4 12Bを公開しました。エンコーダ不要の設計で音声・画像・テキストをネイティブに処理でき、16GBのVRAMで動作するためラップトップへの展開が可能です。Apache 2.0ライセンスで商用利用も許可されています。
AI

Google、Gemini 3.5で70言語のリアルタイム音声翻訳

GoogleがGemini 3.5 Live Translateを発表しました。70言語以上の自動検出でリアルタイム音声翻訳を実現し、話者の声質まで再現します。Gemini Live APIのパブリックプレビューも開始され、音声翻訳を自社サービスに組み込む選択肢が現実的になっています。
AI

2026年のAI解雇波 — 15万人失職と富の偏在が生む社会的摩擦

2026年に入りAIを理由とした解雇が年間15万人規模(前年比44%増)に達しています。一方でAI産業内部では億万長者が続出しており、雇用喪失と富の集中が同時進行する社会的摩擦点が形成されつつあります。
AI

NewCore、$66M調達 — AIエージェントのID管理に特化

AIエージェントが企業の「従業員」として動く時代を見据え、ID管理・セキュリティに特化したNewCoreが$66M(バリュエーション$300M)を調達しました。McKinseyでは既に2.5万のAIエージェントが稼働しており、既存のIAMシステムでは対応できない課題に取り組みます。
AI

BayLing-Duplex:単一LLMで全二重音声対話を初実現

単一のオートレグレッシブLLMで全二重音声対話を実現するBayLing-Duplexが発表されました。外部モジュール不要で話者交代・割り込みを処理し、ターンテイキング成功率92%・割り込み成功率100%を達成しています。
AI

DiffusionGemma 26B — テキスト生成4倍速を達成

GoogleのDeepMindが拡散型言語モデル「DiffusionGemma 26B」を公開しました。Gemma-4と同精度を維持しつつテキスト生成を4倍高速化しており、推論コスト削減やリアルタイム応答が求められる開発現場での活用が期待されます。
AI

Salesforce、Finを36億ドルで買収 — AI顧客対応を強化

SalesforceがAIカスタマーサービスプラットフォームのFin(旧Intercom)を36億ドルで買収しました。自社エージェントプラットフォームAgentforceに統合し、マルチチャネル顧客対応の自動化で競合との差別化を図ります。
AI

EvoArena論文:動的環境でLLMエージェントメモリを進化

EvoArena(arXiv:2606.13681)は変化する環境でLLMエージェントを評価するベンチマーク群で、既存エージェントの平均精度が39.6%にとどまることを明らかにしました。パッチベースのEvoMemメモリはGAIAで+6.1%を達成し、動的環境対応の設計指針を提供しています。
AI

arXiv:Operadic手法でLLM推論誤りをラベル不要検出

arXiv論文(2606.13649)がオペラッド理論を応用した「Operadic Consistency」でLLMの構成的推論失敗をラベルなしで検出する手法を提案しました。12モデルで精度相関0.86以上を実証し、本番環境での信頼性フィルタリングや評価自動化に道を開きます。
AI

中国、Manus買収解消を命令 — AI M&A規制が新段階に

中国当局(NDRC)が2025年12月に成立したMetaによる中国系AIスタートアップManusの約20億ドル買収を国家安全保障を理由に解消命令しました。成立済みM&Aへの外国当局介入という初の事例で、シンガポール移転でも規制を回避できなかった事実が国際AI投資に波及します。