研究・論文

AIエージェント基盤設計がコスト41%左右、Writer論文

Writer社の研究者32人が、AIエージェントの運用コストを左右するのはモデル選択よりオーケストレーション設計だと実験で示しました。6モデル共通でコスト41%、処理時間44%を削減し、品質は維持されています。

2026.07.10

AI研究・論文

研究者らがarXivでWorld Modelを初めて統一定義し、開発ロードマップを提示しました。オムニモーダル・非同期性・局所性という3性質を軸に、ロボティクスや動画生成AIの評価基準として使える枠組みです。

2026.07.09

AI研究・論文

研究チームがAIの自律調査エージェントを狙う新攻撃手法「FORGE」を発表しました。5つの偽文書を仕込む実験でレポートの26.4%が汚染され、防御策により18.3%まで抑えられることも確認されています。

2026.07.08

AI研究・論文

研究者Haggai Roitman氏が2026年6月、自律型AIエージェントの構築技術を基盤層からデプロイまで一冊に整理した論文をarXivで公開しました。散在していた知識を体系的にまとめた実践者向けガイドです。

2026.07.07

AI研究・論文

米パデュー大学の研究者がOpenAIのコーディングエージェントCodexを使い、物理系の機械学習論文4本を12回再現する実験を実施しました。158件の検証対象すべてで論文の主張と一致し、証拠に基づく完了判定の仕組みも示されています。

2026.07.06

AI研究・論文

米国の研究チームが10種類のLLMエージェントを昇進委員会などの討論に参加させた実験で、非公開発言と公開発言の意味的一致度が0.730から0.660へ低下し、矛盾判定の割合も2.1%から19.4%に増加したことが分かりました。

2026.07.06

AI研究・論文

線形アテンション系AIは長文で過去の詳細を忘れやすい課題があります。Wanyun Cui氏のHOLAは予測が外れた箇所だけ厳密に保存する仕組みを追加し、3.4億パラメータでWikitext困惑度を26.88から22.92へ改善しました。

2026.07.05

AI研究・論文

ICML2026採択の論文が、LLMエージェントはベンチマークで高得点でも実運用の変化に弱いと実証しました。知覚・対話・推論・内部状態という4階層で評価し、摂動を加えた再訓練で大幅な改善も確認しています。

2026.07.04

AI研究・論文

研究チームが83のLLMを分析し、人間の知能g因子に似た「創造性因子c」を発見しました。ばらつきの81.5%を単一因子が説明する結果です。

2026.07.03

AI研究・論文

Amazon等の研究チームがLLMの「データ参照エラー」を初めて体系的に測定した論文をACL2026で発表しました。軽量な検証モデルの併用で正答率が最大12%改善しています。

2026.07.02

AI研究・論文