Gemini 3.5 Flash公開 — 4倍高速・半額で常駐エージェントSparkも

2026年5月19日のGoogle I/O 2026で、Googleは新世代AIモデル「Gemini 3.5」シリーズと、常時稼働するパーソナルAIエージェント「Gemini Spark」を発表しました。即日提供が始まった「Gemini 3.5 Flash」は、競合フロンティアモデルと比べてトークン出力速度が約4倍、価格は半額以下で、コーディングやエージェント系ベンチマークでも前世代上位モデルを上回る結果を示しています。AIモデルの「速さとコストの両立」をめぐる競争において、Googleが主導権を取り戻す動きと見られています。

背景と文脈
技術/ビジネス面
これからどうなるか
まとめ
参考リンク

背景と文脈

Googleは2024年のGemini 1.5 Flashで「高速・低コストの推論モデル」という路線を打ち出し、開発者コミュニティで高く評価されました。その後OpenAIが低価格帯モデルのラインナップを整え、Anthropicも小型モデルのHaikuシリーズを投入するなど競争は激化し、モデル選定の基準が「価格性能比」に収束しつつありました。

今回の発表の重要な背景として、Googleの検索AI機能の急速な普及があります。Google検索に統合されたAIチャット機能「AI Mode」は公開からわずか1年で月間アクティブユーザー10億人を達成し、クエリ数は四半期ごとに倍増しています。また、検索結果上部に表示されるAI要約「AI Overviews」は25億ユーザーに到達しました。この規模のトラフィックをリアルタイムで処理するには、速度とコストを両立したモデルが不可欠です。Gemini 3.5 Flashはまさにその役割を担う中核モデルとして位置づけられています。

また、Gemini 3.5 Proは現在社内テスト中で来月の一般公開が予定されています。FlashとProの二層構成が揃うことで、「応答速度重視のAPI呼び出し」と「精度重視の複雑な推論」を用途に応じて使い分けるパターンが整います。

技術/ビジネス面

Gemini 3.5 Flashの主な仕様を整理します。

コンテキストウィンドウ: 入力100万トークン／出力65,536トークン（コンテキストウィンドウとはモデルが一度に参照できるテキスト量のことで、入力100万トークンは日本語文章約200万字に相当します）
入出力形式: テキスト・画像・音声・動画の入力に対応し、出力はテキスト
ツール連携: 関数呼び出し（Function Calling）、構造化出力、検索ツール、コード実行
価格: 入力100万トークンあたり1.50ドル／出力9.00ドル（競合大型モデルの半額以下）
速度: 競合フロンティアモデル比で約4倍のトークン出力速度

ベンチマーク面では、コーディング評価のTerminal-Bench 2.1で76.2%、エージェント評価のMCP Atlas（MCP＝Model Context Protocol、AIエージェントがツールやデータソースを標準的な方法で呼び出すための規格）で83.6%を記録し、前世代のGemini 3.1 Proをいずれも上回っています。マルチモーダル理解のCharXiv Reasoning（数学論文の図表を読み解く視覚的推論ベンチマーク）では84.2%でした。

利用可能なプラットフォームはGemini API・Google AI Studio・Android Studio・Antigravity（GoogleのAIエージェント開発・実行基盤プラットフォーム）・Vertex AI・Geminiアプリ・検索のAI Modeと幅広く、発表当日から全環境で利用できます。

今回の発表のもう一つの柱が常駐型AIエージェント「Gemini Spark」です。SparkはGemini 3.5 Flashを基盤とし、スマートフォンをロックした後もノートPCを閉じた後も24時間稼働し続けます。カレンダー・メール・メモなど接続済みアプリをまたいで情報を参照し、ユーザーが指定した長期タスクを自律的に処理します。現時点ではベータ版で、来週から米国内のGoogle AI Ultraサブスクライバーを対象に順次提供が始まります。将来的にはSpark宛てのメール・SMS送信、サブエージェントの作成、ブラウザ操作機能の追加が予告されています。

これからどうなるか

開発者の視点では、Gemini 3.5 FlashはRAG（Retrieval-Augmented Generation、検索結果をLLMに組み合わせて回答を生成する手法）のパイプラインや、エージェントが外部ツールを繰り返し呼び出す処理で現実的なコスト選択肢になります。入力1.50ドル／出力9.00ドルの価格はClaude 3.5 HaikuやGPT-4o miniと同価格帯で、ベンチマーク数値だけでなく自社ユースケースでの実測を経てモデル選定を見直す価値があります。

Gemini Sparkのような常駐型エージェントが普及すると、ユーザーとAIの関係は「都度のチャット」から「バックグラウンドで継続して動くアシスタント」へ変わります。アプリ開発者にとっては、従来のプッシュ通知やWebhookを超えた新しいエージェント連携様式を設計する必要が生まれます。GoogleがAntigravity 2.0を通じてエージェント向けインフラを整備しているのも、この変化を前提としたエコシステム構築の一環と見られます。