開発者ツール

NewCore、$66M調達 — AIエージェントのID管理に特化

AIエージェントが企業の「従業員」として動く時代を見据え、ID管理・セキュリティに特化したNewCoreが$66M（バリュエーション$300M）を調達しました。McKinseyでは既に2.5万のAIエージェントが稼働しており、既存のIAMシステムでは対応できない課題に取り組みます。

2026.06.16

AI開発者ツール

EvoArena論文：動的環境でLLMエージェントメモリを進化

EvoArena（arXiv:2606.13681）は変化する環境でLLMエージェントを評価するベンチマーク群で、既存エージェントの平均精度が39.6%にとどまることを明らかにしました。パッチベースのEvoMemメモリはGAIAで+6.1%を達成し、動的環境対応の設計指針を提供しています。

2026.06.15

AI開発者ツール

HyperTool論文：ツール呼び出し並列化でエージェント精度2倍に

arXiv論文（2606.13663）が提案するHyperToolは、エージェントが複数ツールを1ブロックで並列実行できるインターフェースです。MCP-Universeベンチマークでは同一モデルの精度が2倍以上になり、ツール実行設計の重要性を実証しています。

2026.06.15

AI開発者ツール

Kimi K2.7-Code公開 — 1兆パラメータOSSがMCPMarkでOpus超え

Moonshot AIが1兆パラメータのコーディング特化OSSモデル「Kimi K2.7-Code」を公開しました。MCPMark VerifiedでClaude Opus 4.8（76.4%）を上回る81.1%を記録し、Modified MITライセンスでHugging FaceとAPIから利用できます。

2026.06.14

AI開発者ツール

EurekAgent: 科学発見を自動化するエージェント環境設計

arXiv論文EurekAgent（2606.13662）が「エージェントの環境設計こそが科学的発見のボトルネック」と主張しました。権限・アーティファクト・予算・人間参加の4軸フレームワークを提案し、$11未満のAPIコストで数学の未解決問題に新記録を達成しています。

2026.06.13

AI開発者ツール

ThinkBoosterが公開 — LLM推論の計算コストを動的最適化

LLM推論時の計算量を動的に増やして精度を上げる「テスト時計算（TTC）」手法を統合管理するOSSフレームワーク「ThinkBooster」が公開されました。OpenAI互換プロキシで既存アプリにほぼそのまま組み込め、重要タスクだけに高精度推論を適用するコスト最適化パイプラインの設計が現実的になります。

2026.06.09

AI開発者ツール

Nemotron 3 Ultra公開 — NVIDIA最強オープンモデルの実力

NVIDIAが550B（55Bアクティブ）の大規模オープン推論モデルNemotron 3 Ultraを公開しました。米国オープンウェイト最高の知能指数48を記録し、スループットは中国競合の3〜6倍。商用利用可で自社サーバーにデプロイできます。

2026.06.08

AI開発者ツール

Qwen3.7-Plus正式公開 — 動画対応でMaxの6分の1の低コスト

AlibabaのQwen3.7-Plusがエージェント向け低コストマルチモーダルモデルとして正式公開されました。テキスト・画像・動画入力に対応し、入力$0.4/MはQwen 3.7 Maxの6倍安く、コスト重視のパイプラインに適しています。

2026.06.07

AI開発者ツール

Odysseus：PewDiePie発OSSのAIワークスペース急拡散

PewDiePieがリリースした自己ホスト型AIワークスペース「Odysseus」が6日間でGitHub 44,000 starsを超えました。チャット・AIエージェント・メール・カレンダーをローカルで一元管理でき、テレメトリなしのプライバシー重視設計で注目されています。

2026.06.05

AI開発者ツール

Goose — BlockのOSSエージェントでClaude Codeを代替

Square・Cash App傘下のBlock社が開発するOSSコーディングエージェントGooseが、月額最大200ドルのClaude Codeの代替として注目されています。GitHubスター2.9万超、モデル非依存設計でローカル実行も可能です。

2026.06.04

AI開発者ツール