OpenAIが2026年6月24日、半導体大手Broadcomと共同開発した初の独自プロセッサ「Jalapeño(ハラペーニョ)」を公開しました。AIモデルがユーザーのリクエストに応答する処理である推論(インファレンス:学習済みモデルを動かして出力を得る段階)に特化した設計で、現行の最先端製品と比べてワットあたりの処理性能が大幅に改善されています。自社インフラへの展開を通じてNvidiaへの依存を段階的に減らし、運用コストを最適化することがOpenAIの狙いです。
背景と文脈
AIサービスを大規模に運用すると、推論コストが経営を圧迫する大きな課題になります。学習は一度完了すれば繰り返す必要がありませんが、推論はユーザーがサービスを利用するたびに何百万回も実行され続けます。ChatGPTのような会話AIでは、1回の回答を返すだけでも相当量の演算資源を消費するため、利用者が増えるほど費用が積み上がります。
これまでOpenAIはNvidiaのH100・H200 GPUに大きく依存してきました。GPUはもともとグラフィックス処理向けに開発されたハードウェアです。AI推論に必要な特定の演算パターンに対しては機能が過剰で、エネルギー効率の観点で課題があります。GoogleがTPU(Tensor Processing Unit:テンソル演算に特化したGoogleの独自プロセッサ)を、AmazonがInferentiaを内製してきた理由も同じです。「汎用より用途特化のほうが、コストと性能で優位に立てる」という判断が共通の出発点でした。
BroadcomとのJalapeño共同開発は2025年10月に発表されており、今回はその成果物の初公開にあたります。開発過程ではOpenAI自身のAIモデルが設計補助に活用されたとされており、AIがAI向け半導体の設計を助ける象徴的な事例にもなっています。OpenAIはこの取り組みについて「スタック全体を自社でコントロールし、モデルをより速く、安定して、安価に提供する」という方針として位置づけています。
技術/ビジネス面

Jalapeñoの最大の特長は「ワットあたりの処理性能が現行最先端を大幅に上回る」点です。データセンター運用では電力コストが支出の大きな割合を占めます。消費電力あたりにどれだけの推論リクエストをさばけるかは、単位コストに直結する指標です。OpenAIはこの数値が「現行の最先端製品と比べて大幅に改善されている」と主張しており、具体的な数値は現在評価中としています。
重要なのはJalapeñoが「推論専用」である点です。GPT-4やo3のような大規模モデルの事前学習(Pretraining:大量のデータを使ってモデルの重みを初期構築するプロセス)には引き続きNvidiaのGPUが使われます。Jalapeñoは完成したモデルを動かす段階——ユーザーからの質問に答え、コードを生成し、画像を解析する部分——に集中することで、より効率的な設計を実現しています。
チップはまだ評価段階にあります。外部への販売や提供は予定されておらず、当面はOpenAI自身のデータセンター内部での活用が中心になります。Broadcomとの協業という形をとっているのは、OpenAI単独でファブレス半導体メーカーとして動くより、Broadcomの製造・設計ノウハウを活用するほうがコストと時間の両面で現実的と判断されたためです。
これからどうなるか
Jalapeñoの本格展開が進めば、OpenAIはAPIの価格引き下げを検討しやすい立場になります。推論コストが下がった分をユーザーに還元できるからです。OpenAI APIを使ったRAGパイプライン(Retrieval-Augmented Generation:外部ドキュメントを検索してLLMに渡すシステム構成)やエージェントシステムの運用コスト試算は、今後のチップ展開状況によって変わる可能性があります。
業界への波及も注目点です。GoogleとAmazonが先行する独自チップ戦略にOpenAIが加わったことで、AI推論特化ハードウェアの競争が一段階加速します。同時期にQualcommがAIチップスタートアップTenstorrentを最大100億ドル(約1兆5000億円)で買収交渉中との報道もあり、半導体各社が推論市場への布陣を急ぐ動きが鮮明になっています。
Nvidiaは今のところ大きなシェアを保っていますが、主要AI企業が相次いで内製化路線を明確にしたことは、長期的な市場構造の変化を示しています。開発者がすぐに体感できる変化ではありませんが、APIコスト低下や応答速度の改善という形で恩恵が届く可能性があります。
まとめ
OpenAIがBroadcomと共同開発した推論専用チップ「Jalapeño」は、AI運用コストの構造的課題に正面から向き合う取り組みです。汎用GPUへの依存を減らし、推論効率を高めることで、将来的なAPIコスト低下とサービス拡充が期待されます。評価段階にある現在、実際の導入効果は今後の続報を待つ必要があります。
参考リンク
アイキャッチ画像: Photo by ThisisEngineering on Unsplash

