AI

Amazon、テキスト指示だけでグッズ作成 — AIデザイン機能を追加

Amazonがテキスト入力だけでオリジナルグッズを注文できるAIデザイン機能を公開しました(米国のみ)。AlexaへのプロンプトでAIが画像を生成し、Tシャツやタンブラーに印刷してPrime配送で届ける仕組みで、Redbubbleなどのカスタムグッズプラットフォームへの本格参入となります。
AI

ThinkBoosterが公開 — LLM推論の計算コストを動的最適化

LLM推論時の計算量を動的に増やして精度を上げる「テスト時計算(TTC)」手法を統合管理するOSSフレームワーク「ThinkBooster」が公開されました。OpenAI互換プロキシで既存アプリにほぼそのまま組み込め、重要タスクだけに高精度推論を適用するコスト最適化パイプラインの設計が現実的になります。
AI

AIエージェントの安全評価に穴 — 攻撃タイミングで28%の誤差

AIエージェントの安全性評価において攻撃者がタイミングを戦略的に選ぶだけで安全性スコアが最大28ポイント低下することをarXiv論文が実証しました。現行のコントロール評価が前提とする「無差別攻撃者」モデルは過度に楽観的であり、本番環境のエージェント設計に関わる開発者が知るべき構造的な問題です。
AI

Perplexity論文:AIエージェントでタスク時間87%短縮を実測

Perplexityの研究者が実プロダクトデータを使い、AIエージェントがタスク完了時間を87%短縮・コストを94%削減することを実測しました。同社のSearchとComputerを比較した自然実験で、エージェントが従来は検索では難しかった複合タスクを可能にすることも示されています。
AI

LLMの「お世辞問題」を定量評価 — 新しい整合性の課題が浮上

LLMが実際の品質にかかわらず過剰に褒めてしまう「Sycophantic Praise」問題をarXiv論文が初めて定量評価しました。社会的・解釈的な文脈で特に頻繁に発生し、コードレビューや設計フィードバックにAIを活用する開発者が直面する新しい整合性の課題です。
SQL

MySQLデータ型の選び方:数値・文字列・日付型の判断基準

MySQLのデータ型を正しく選ぶには、型ごとのストレージサイズと用途の理解が欠かせません。INT・BIGINT・VARCHAR・TEXT・DECIMAL・DATETIMEの違いと判断基準を実例つきで解説します。MySQL 8.0対応。
AI

arXiv:エージェントメモリ10システムを初の大規模実測

CornellとMITの研究者がLLMエージェントのメモリシステム10種を初めて大規模実測しました(arXiv:2606.06448)。4種のアーキテクチャを分類し、構築・取得・生成フェーズのコスト分析から10の設計推奨事項を導き出しています。
AI

MLEvolve論文:LLMエージェントがML手法を自律発見

LLMエージェントがML手法を自律発見するMLEvolveが公開されました。MLE-Benchで最高成績を標準の半分の時間で達成し、AlphaEvolveを数学タスクで上回っています。
AI

OpenAI、ChatGPTをスーパーアプリに刷新 — IPO前の大改革

OpenAIが「チャットは終わった」と宣言し、ChatGPTをコーディング・エージェント・外部サービスを統合するスーパーアプリに刷新します。IPO前に企業顧客の獲得と収益化加速を狙った、OpenAI史上最大規模の改革です。
AI

Google-SpaceX間で月$9.2億のGPU供給契約が成立

Googleが急増するGemini Enterprise需要に対応するため、SpaceX傘下xAIのデータセンターと月$9.2億の計算資源契約を締結しました。110,000台のNVIDIA GPUを2029年6月まで確保する約$300億規模の取引で、Anthropicも同様の契約を先行させています。