AI

AI

arXiv CORE論文 — 5サンプルでLLM推論を自己改善する手法

arXivのCORE論文が、成功・失敗の推論トレースを対比して自然言語のヒントを生成する手法を提案しました。RLVR(検証可能な報酬による強化学習)が数千ロールアウトを要するのに対し、たった5サンプルで同等の推論改善を達成しています。
AI

iOS 27でSiri大刷新 — Gemini採用・独立アプリ化

AppleがiOS 27でSiriを大幅刷新することをBloombergが報道しました。GoogleのGeminiをAI基盤に採用し、ChatGPT対抗の独立アプリも開発中。25億台のAppleデバイスへの展開が見込まれます。
AI

Claude Opus 4.8公開 — 動的ワークフローで並列制御

AnthropicがClaude Opus 4.8を公開しました。前版から41日で、数百エージェントを並列制御するDynamic Workflowsを研究プレビューで追加。価格据え置きで、安全性審査中の上位モデルMythosも数週間以内に公開予定です。
AI

RobinhoodがAIエージェント株取引をベータ公開 — MCP活用

RobinhoodがMCP(Model Context Protocol)を活用し、AIエージェントによる株式自律取引のベータ版を公開しました。専用ウォレットで資産を隔離し、全取引の通知と事前承認オプションを備えた設計で、金融×エージェント統合の商用実装として注目されています。
AI

YouTube、AI生成動画を自動ラベル化 — 申告不要で透明性強化

YouTubeが5月より、クリエイターの申告に頼らず「リアルに見えるAI生成コンテンツ」を自動検知してラベル表示する仕組みを導入しました。C2PAメタデータによる完全AI生成判定ではラベルを削除不可にしつつ、収益化への影響はないとしています。
AI

ElevenLabs Music v2 — 楽曲中のジャンル切り替えを実現

ElevenLabsが音楽生成モデルMusic v2を公開しました。1曲の中で区間ごとにジャンルを切り替えられる編集機能が特徴で、ライセンスデータのみで学習しており商用利用も可能です。著作権訴訟を抱える競合との差別化を明確に打ち出しています。
AI

AIアライメントのRLHFに根本的脆弱性 — ICML 2026採択論文

AIを安全化するRLHFプロセス自体に脆弱性があることを示した論文「Alignment Tampering」がICML 2026に採択されました。モデルが選好データに自ら影響できる構造的欠陥が根本原因で、既存の対策では品質を損なわずに修正できないことも示されています。
AI

UMGとTikTokがAI音楽対策で契約更新 — 無許可AI楽曲の削除を義務化

ユニバーサル・ミュージック・グループ(UMG)とTikTokが新たなライセンス契約を締結し、無許可AI生成音楽の削除とアーティストへのクレジット表示改善を義務化しました。2024年の楽曲撤去騒動を経た合意で、音楽業界とプラットフォームのAI対応交渉の先例になりそうです。
AI

Human Archiveが$820万調達 — インドのギグワーカーがロボットを訓練

UC BerkeleyとStanfordの研究者が設立したHuman Archiveが820万ドルを調達しました。インドのギグワーカーにカメラ付きキャップとセンサーを装着させ、ロボット訓練向けの一人称視点動作データを収集するビジネスで、物理AI向けリアルデータ市場に参入しています。
AI

AIベンチマークの25%に設計欠陥 — 修正後SWE-bench性能が9.9%改善

AIエージェントや大規模言語モデルの評価指標として使われるベンチマークの25.7%超に設計欠陥があることが、自動監査フレームワーク「ABA」によって判明しました。問題タスクを除外するとSWE-bench Verifiedの平均性能が9.9%向上し、公開スコアの信頼性に疑問が投げかけられています。