AI

RA-RFT: 検索で「類推」を教えLLMのAIMEスコアを改善

arXiv論文RA-RFT(2606.13680)が、意味的類似度ではなく推論有用性で事例を検索する手法と強化学習を組み合わせ、AIME 2025でGRPO比+7.1ポイントを達成しました。推論認識型検索は既存の強化学習改善と直交する新しい精度向上軸として注目されます。
AI

System 0理論: AIが人間の思考を「植民地化」する仕組み

arXiv論文(2606.13658)がAI介在型の認知を説明する「System 0」概念を提唱しました。AIが思考の前段階で問いの枠組みを形成し、外部利益を思考構造へ埋め込む「認知の植民地化」は、AIツール設計・規制・倫理の各層で新たな議論を呼ぶ可能性があります。
AI

EurekAgent: 科学発見を自動化するエージェント環境設計

arXiv論文EurekAgent(2606.13662)が「エージェントの環境設計こそが科学的発見のボトルネック」と主張しました。権限・アーティファクト・予算・人間参加の4軸フレームワークを提案し、$11未満のAPIコストで数学の未解決問題に新記録を達成しています。
AI

MaxProof: IMO 2025でAIが金メダル水準突破

MaxProof(arXiv:2606.13473)がIMO 2025で35/42点、USAMO 2026で36/42点を達成し、人間の金メダル水準を初めて超えました。証明の生成・検証・修復を単一モデルが担うテスト時スケーリング設計で、ソフトウェア形式検証への応用も期待されます。
SQL

LIMIT OFFSETページングの限界とSEEK方式の使い方

LIMITとOFFSETを使ったページング処理が大量データで遅くなる原因を実行計画で確認し、WHERE句でインデックスを最大活用する「SEEK方式」への切り替え方を実例つきで解説します。MySQL 8.0対応。
AI

ワーナー・ミュージック、Sureel AI買収でAI楽曲追跡を内製化

ワーナー・ミュージックがAI帰属追跡スタートアップSureel AIを買収しました。楽曲に固有の識別子を付与してAIモデルへの利用を追跡する技術を内製化し、アーティストの知的財産管理を強化します。学習データの透明性確保が義務化される規制動向とも重なり、業界全体への影響が注目されます。
AI

WWDC 2026:AppleがGemini統合の新Siriを発表

AppleがWWDC 2026でGoogle Geminiを統合した刷新版SiriとiOS 27を発表しました。会話継続・視覚認識・クロスアプリ文脈認識が大幅に強化され、プライバシー保護との両立にPrivate Cloud Computeを採用。Shortcutsの自然言語対応は開発者の自動化設計にも直接影響します。
AI

Decart、光写実な自動運転シミュレーターOasis 3をAPI公開

Decartがテキストプロンプトからリアルタイムでリアルな走行シーンを生成する世界モデルOasis 3を公開し、$0.02/秒でAPI提供を開始しました。マルチカメラ対応で無制限のシナリオ生成が可能な一方、長時間走行での環境劣化という制限もあり、現段階では学習データ補完用途が現実的です。
AI

推論モデルが安全配置を劣化させる — 6軸評価で実証 arXiv

arXiv論文(2606.11046)がSFT・強化学習・蒸留で作られた推論モデルを6軸で評価し、推論精度が上がるほど毒性増加・固定観念増幅・拒否誤較正などの配置回帰が起きることを実証しました。推論ベンチマークだけでモデルを選ぶ開発者が増えている今、信頼性評価の欠落が問題になっています。
AI

arXiv:CoT微調整でハイブリッドLLMの長文脈能力が崩壊

ハイブリッドLLMにCoT微調整を施すと長文脈検索が67%から9%に低下する「Attention Amnesia」現象をarXiv(2606.11052)が実証しました。原因はWQ・WKパラメータの破損で、訓練不要なQK-Restore手法で復元できます。