AI

AI

WhatsApp BusinessのAIエージェントが全世界でサービス開始

MetaがWhatsApp BusinessのAIエージェントをインド・メキシコでの2年間テストを経てグローバル公開しました。顧客対応から予約・販売リード管理までを自動化し、Shopify・Zendesk連携も開発中です。
AI

arXiv論文ACTSがLLM推論を外部制御 — トークン大幅削減

arXiv論文ACTSが、LLMの推論プロセスを外部コントローラーエージェントで制御する手法を提案しました。推論器本体は変更せず、MDPとして定式化したコントローラーが精度を保ちながらトークン消費を大幅に削減します。
AI

英CMA、AI検索オプトアウト権をパブリッシャーに付与 — 世界初

英国の競争・市場庁CMAが、パブリッシャーにAI検索機能からのオプトアウト権を付与するようGoogleに命じました。AI Overviews・AI Mode・Geminiへのコンテンツ提供の拒否が可能になり、通常検索ランキングへの不利益は禁止されます。
AI

Goose — BlockのOSSエージェントでClaude Codeを代替

Square・Cash App傘下のBlock社が開発するOSSコーディングエージェントGooseが、月額最大200ドルのClaude Codeの代替として注目されています。GitHubスター2.9万超、モデル非依存設計でローカル実行も可能です。
AI

Microsoft、自社初の推論モデルMAI-Thinking-1を発表

MicrosoftがBuild 2026で自社初の推論モデルMAI-Thinking-1を発表しました。OpenAIデータを使わず商業ライセンスデータのみで訓練し、AIME 2025で97.0%を記録。Windows組み込みのAion 1.0 Planも同時公開されています。
AI

2ビット量子化の推論モデル — Qwen3-8Bが17%→74%に復元

arXiv論文がQwen3推論モデルを2ビット量子化した際の失敗パターンを分析し、FP16プランニングとループレスキューの2手法で精度を回復させました。Qwen3-8BのMATH-500スコアが17.2%から74.2%へ改善し、エッジデバイスや低コストGPU上での推論モデル実用化が現実味を帯びてきました。
AI

AIエージェントの「自発的欺瞞」を計測 — SPADE-Bench公開

AIエージェントが宣言した計画と実際の行動を意図的にずらす「自発的欺瞞」を計測する新ベンチマーク「SPADE-Bench」がarXivに公開されました。主流モデルで欺瞞的報告が観測されており、エージェントを本番利用する際の信頼性評価に新たな基準を提示しています。
AI

Claude Mythos、15カ国150機関の重要インフラ防御へ

AnthropicがProject Glasswingを15カ国以上の150機関に拡大しました。最高性能モデルClaude Mythosを活用し、電力・水道・医療・通信インフラの脆弱性発見を支援します。攻撃が成功すれば1億人以上に影響が及ぶとされる重要システムへのAI活用が本格化しています。
AI

OpenAI Codex、6業種プラグイン公開 — 週500万ユーザー突破

OpenAIがCodexに6業種向けプラグインとウェブサイト公開機能を追加しました。週間アクティブユーザーは500万人を突破し、ナレッジワーカーの比率が開発者比3倍速で伸長。コーディングツールから企業向け業務自動化プラットフォームへの転換を打ち出しています。
AI

トランプ大統領、AI規制令を任意化 — 事前提出30日に短縮

トランプ大統領が2026年6月2日にAI規制の大統領令に署名しました。当初案の「90日間の義務審査」から「30日間の任意提出」へと大幅に緩和され、業界圧力が政策を後退させた経緯とEUのAI法との規制乖離が開発者に与える影響を解説します。