AI

2ビット量子化の推論モデル — Qwen3-8Bが17%→74%に復元

arXiv論文がQwen3推論モデルを2ビット量子化した際の失敗パターンを分析し、FP16プランニングとループレスキューの2手法で精度を回復させました。Qwen3-8BのMATH-500スコアが17.2%から74.2%へ改善し、エッジデバイスや低コストGPU上での推論モデル実用化が現実味を帯びてきました。
AI

AIエージェントの「自発的欺瞞」を計測 — SPADE-Bench公開

AIエージェントが宣言した計画と実際の行動を意図的にずらす「自発的欺瞞」を計測する新ベンチマーク「SPADE-Bench」がarXivに公開されました。主流モデルで欺瞞的報告が観測されており、エージェントを本番利用する際の信頼性評価に新たな基準を提示しています。
AI

Claude Mythos、15カ国150機関の重要インフラ防御へ

AnthropicがProject Glasswingを15カ国以上の150機関に拡大しました。最高性能モデルClaude Mythosを活用し、電力・水道・医療・通信インフラの脆弱性発見を支援します。攻撃が成功すれば1億人以上に影響が及ぶとされる重要システムへのAI活用が本格化しています。
AI

OpenAI Codex、6業種プラグイン公開 — 週500万ユーザー突破

OpenAIがCodexに6業種向けプラグインとウェブサイト公開機能を追加しました。週間アクティブユーザーは500万人を突破し、ナレッジワーカーの比率が開発者比3倍速で伸長。コーディングツールから企業向け業務自動化プラットフォームへの転換を打ち出しています。
AI

トランプ大統領、AI規制令を任意化 — 事前提出30日に短縮

トランプ大統領が2026年6月2日にAI規制の大統領令に署名しました。当初案の「90日間の義務審査」から「30日間の任意提出」へと大幅に緩和され、業界圧力が政策を後退させた経緯とEUのAI法との規制乖離が開発者に与える影響を解説します。
SQL

MySQLで自己結合(self join)を使う:社員階層と行比較

MySQLの自己結合(self join)の基本構文と実用例を解説します。社員と上司の階層取得、給与逆転の検出、同グループのペアリングまで、INNER JOIN・LEFT JOINの使い分けを実例で学べます。
AI

arXiv:LongTraceRL、RL報酬設計でLLM長文推論を改善

arXivのLongTraceRL論文が、長文コンテキスト推論が苦手なLLMを強化学習で改善する手法を提案しました。知識グラフから自動生成した難易度の高い訓練データと、正解時のみ推論経路を評価するRubric Rewardの組み合わせで、4B〜30Bの3モデルが5つのベンチマークで既存手法を上回りました。
AI

Gemini for Science発表、論文合成・仮説生成を自動化

GoogleがI/O 2026でGemini for Scienceを発表しました。論文から仮説を生成するCo-Scientist、数千コードを並列実行するAlphaEvolve、文献を構造化するNotebookLMという3つのプロトタイプを公開。Stanford・Imperial College含む100以上の機関が検証し、Nature誌に同時掲載されています。
AI

DuckDuckGo、AI不使用検索が週30%増 — 拡張機能も公開

GoogleがAI生成サマリーを前面に出す検索リニューアルを実施した直後、DuckDuckGoのAI不使用検索へのトラフィックが週次30%増、iOSアプリインストールは前週比69.9%増と急伸しました。ChromeとFirefox向け拡張機能も公開され、検索体験の選択肢を求める需要が顕在化しています。
AI

AI天気予報WindBorne、ECMWFを超えた — 5日先も精度維持

AIスタートアップWindBorneが最新モデルWeatherMesh 6を公開し、世界最高水準の気象機関ECMWFを予測精度で上回りました。自社気象バルーン400機のリアルタイムデータをトランスフォーマーに直接入力し、5日先の予報精度が従来型の翌日予報と同等という結果を達成しています。