AI

arXiv:画像を推論媒体とするOptical Reasoningが登場

テキスト推論の代わりに画像を推論キャンバスとして使うOptical ReasoningがarXivに公開されました(2606.09585)。言語タスクで推論トークンを28.57%削減しながら同等精度を維持。エージェント推論のAPIコスト削減につながる新アプローチです。
AI

arXiv:RLHFは表層的整合のみ — 党派的偏向は重みに残る

arXiv論文がRLHFによるアライメントの脆弱性を実証しました。LLMは整合後も内部に党派的な偏向構造を保持しており、ユーザーの政治的文脈を与えると偏った出力が再活性化します。他の価値領域にも同様の現象が起きる可能性があります。
AI

arXiv:コンテキスト圧縮モデルLCLM — 長文脈を1/16に縮小

arXiv論文(2606.09659)がコンテキストを最大1/16に圧縮するLCLMを提案しました。0.6Bエンコーダと4Bデコーダを組み合わせ、性能・速度・メモリの3軸でパレート最適を達成。長文脈エージェントやRAGのコスト削減に直結します。
AI

Lovable、ARR $500M達成 — AIコーディングの民主化

ヨーロッパ発のAIコーディングスタートアップLovableがARR$500Mを達成しました。週100万件の新規プロジェクト、累計5000万件超という成長速度は、非技術者がAIでアプリを自前構築するバイブコーディング市場の本格化を示しています。
AI

Anthropic、Claude Fable 5を一般公開 — 最強モデルがAPIで使える

Anthropicが最高位モデルClaude Fable 5を一般公開しました。価格はOpus 4.8の2倍(出力$50/Mトークン)ですが6月22日まで全プランで無料。エージェント・コーディング精度が前世代比10%超向上しています。
SQL

MySQLのDELETE・TRUNCATE・DROPの違いと使い分け

MySQLのDELETE・TRUNCATE・DROPの動作の違いをロールバック・AUTO_INCREMENT・性能の観点から整理します。実例のSQL付きで、どれを使うべきかの判断基準を示します。
AI

Amazon、テキスト指示だけでグッズ作成 — AIデザイン機能を追加

Amazonがテキスト入力だけでオリジナルグッズを注文できるAIデザイン機能を公開しました(米国のみ)。AlexaへのプロンプトでAIが画像を生成し、Tシャツやタンブラーに印刷してPrime配送で届ける仕組みで、Redbubbleなどのカスタムグッズプラットフォームへの本格参入となります。
AI

ThinkBoosterが公開 — LLM推論の計算コストを動的最適化

LLM推論時の計算量を動的に増やして精度を上げる「テスト時計算(TTC)」手法を統合管理するOSSフレームワーク「ThinkBooster」が公開されました。OpenAI互換プロキシで既存アプリにほぼそのまま組み込め、重要タスクだけに高精度推論を適用するコスト最適化パイプラインの設計が現実的になります。
AI

AIエージェントの安全評価に穴 — 攻撃タイミングで28%の誤差

AIエージェントの安全性評価において攻撃者がタイミングを戦略的に選ぶだけで安全性スコアが最大28ポイント低下することをarXiv論文が実証しました。現行のコントロール評価が前提とする「無差別攻撃者」モデルは過度に楽観的であり、本番環境のエージェント設計に関わる開発者が知るべき構造的な問題です。
AI

Perplexity論文:AIエージェントでタスク時間87%短縮を実測

Perplexityの研究者が実プロダクトデータを使い、AIエージェントがタスク完了時間を87%短縮・コストを94%削減することを実測しました。同社のSearchとComputerを比較した自然実験で、エージェントが従来は検索では難しかった複合タスクを可能にすることも示されています。