開発者ツール

AI

Gemma 4 12B公開 — 音声対応・エンコーダ不要のオープンマルチモーダルモデル

GoogleがオープンソースモデルGemma 4 12Bを公開しました。エンコーダ不要の設計で音声・画像・テキストをネイティブに処理でき、16GBのVRAMで動作するためラップトップへの展開が可能です。Apache 2.0ライセンスで商用利用も許可されています。
AI

NewCore、$66M調達 — AIエージェントのID管理に特化

AIエージェントが企業の「従業員」として動く時代を見据え、ID管理・セキュリティに特化したNewCoreが$66M(バリュエーション$300M)を調達しました。McKinseyでは既に2.5万のAIエージェントが稼働しており、既存のIAMシステムでは対応できない課題に取り組みます。
AI

EvoArena論文:動的環境でLLMエージェントメモリを進化

EvoArena(arXiv:2606.13681)は変化する環境でLLMエージェントを評価するベンチマーク群で、既存エージェントの平均精度が39.6%にとどまることを明らかにしました。パッチベースのEvoMemメモリはGAIAで+6.1%を達成し、動的環境対応の設計指針を提供しています。
AI

HyperTool論文:ツール呼び出し並列化でエージェント精度2倍に

arXiv論文(2606.13663)が提案するHyperToolは、エージェントが複数ツールを1ブロックで並列実行できるインターフェースです。MCP-Universeベンチマークでは同一モデルの精度が2倍以上になり、ツール実行設計の重要性を実証しています。
AI

Kimi K2.7-Code公開 — 1兆パラメータOSSがMCPMarkでOpus超え

Moonshot AIが1兆パラメータのコーディング特化OSSモデル「Kimi K2.7-Code」を公開しました。MCPMark VerifiedでClaude Opus 4.8(76.4%)を上回る81.1%を記録し、Modified MITライセンスでHugging FaceとAPIから利用できます。
AI

EurekAgent: 科学発見を自動化するエージェント環境設計

arXiv論文EurekAgent(2606.13662)が「エージェントの環境設計こそが科学的発見のボトルネック」と主張しました。権限・アーティファクト・予算・人間参加の4軸フレームワークを提案し、$11未満のAPIコストで数学の未解決問題に新記録を達成しています。
AI

ThinkBoosterが公開 — LLM推論の計算コストを動的最適化

LLM推論時の計算量を動的に増やして精度を上げる「テスト時計算(TTC)」手法を統合管理するOSSフレームワーク「ThinkBooster」が公開されました。OpenAI互換プロキシで既存アプリにほぼそのまま組み込め、重要タスクだけに高精度推論を適用するコスト最適化パイプラインの設計が現実的になります。
AI

Nemotron 3 Ultra公開 — NVIDIA最強オープンモデルの実力

NVIDIAが550B(55Bアクティブ)の大規模オープン推論モデルNemotron 3 Ultraを公開しました。米国オープンウェイト最高の知能指数48を記録し、スループットは中国競合の3〜6倍。商用利用可で自社サーバーにデプロイできます。
AI

Qwen3.7-Plus正式公開 — 動画対応でMaxの6分の1の低コスト

AlibabaのQwen3.7-Plusがエージェント向け低コストマルチモーダルモデルとして正式公開されました。テキスト・画像・動画入力に対応し、入力$0.4/MはQwen 3.7 Maxの6倍安く、コスト重視のパイプラインに適しています。
AI

Odysseus:PewDiePie発OSSのAIワークスペース急拡散

PewDiePieがリリースした自己ホスト型AIワークスペース「Odysseus」が6日間でGitHub 44,000 starsを超えました。チャット・AIエージェント・メール・カレンダーをローカルで一元管理でき、テレメトリなしのプライバシー重視設計で注目されています。