OpenAIが発表したGPT-5の数学的ブレークスルーが、後に「誤報」であったと判明しました。MetaやGoogle DeepMindの幹部、そして著名な数学者らが指摘したことにより、AIの成果検証の甘さが浮き彫りになっています。GPT-5は未解決の数学問題を解決したわけではなく、既存の文献から解答を発見したに過ぎませんでした。この一件は、AIの能力評価と発表における厳密性の重要性を改めて示すものです。
GPT-5「未解決数学問題解決」発表の波紋
OpenAIの副社長であるケビン・ワイル氏は、GPT-5が未解決の数学問題「Erdős(エルデシュ)問題」の10問を解決し、さらに11問で進展を見せたと発表しました。この発表はAIコミュニティに大きな期待を呼び、GPT-5が人間の知能に匹敵する、あるいはそれを超える数学的能力を持つ可能性を示唆しているとされました。
Erdős問題とは、20世紀の偉大な数学者ポール・エルデシュが提唱した数々の有名な未解決予想群を指します。数学界では、これらの問題の解決は極めて困難とされてきました。そのため、GPT-5がこれらの難問を解決したという報道は、AIが新たな数学的発見を自ら行う「ブレークスルー」として大きな注目を集めました。
Meta・DeepMind・数学者から「誤報」指摘
しかし、このOpenAIの発表に対し、複数の著名なAI研究者や数学者から異論が唱えられました。MetaのAI主任研究者ヤン・ルカン氏は、OpenAIの発表を「彼ら自身のGPTardsによって吊し上げられた」(Hoisted by their own GPTards)と酷評しました。また、Google DeepMindのCEOであるデミス・ハサビス氏も、「これは恥ずかしいことだ」と批判的なコメントをX(旧Twitter)に投稿しています。
Erdős問題のウェブサイトを運営する数学者のトーマス・ブルーム氏も、ワイル氏の発表を「劇的な誤報」と指摘しました。ブルーム氏によると、GPT-5が見つけたのは、自身が認知していなかった既存の文献に記載されている解決策であり、未解決問題を新たに解明したわけではないとのことです。つまり、GPT-5は数学的な発見をしたのではなく、高度な文献検索能力を示したに過ぎないという見解が示されました。
この指摘により、GPT-5が「未解決の数学問題を解決した」という当初の主張は事実と異なることが明確になりました。AIの発表内容に対する厳しい検証が求められる結果となりました。
OpenAIが訂正:GPT-5の数学的貢献はどこまで?
批判を受け、OpenAIの研究者セバスチャン・ブベック氏は、GPT-5が発見したのは「文献中の解決策のみ」であったことを認め、発表内容を訂正しました。同氏は、未解決問題そのものを解決したわけではないとしながらも、既存の膨大な文献の中から適切な解決策を見つけ出すことは「非常に困難な作業」であり、AIの重要な成果であると擁護しました。しかし、この説明は、当初の「未解決問題の解決」という主張とは大きく異なります。
この一件は、AI技術の能力を評価する際の言葉の定義や、その成果をどのように発表するべきかという点に深い議論を投げかけました。特に、高度な数学的知見を伴う成果については、専門家による厳密な検証と正確な情報開示が不可欠であることが改めて浮き彫りになりました。AIが文献から情報を引き出す能力は評価されるべきですが、それが「新たな発見」と混同されてはなりません。
この騒動は、AIがもたらす革新への期待と同時に、その限界や誤解を招く可能性についても冷静な視点が必要であることを示しています。
AIにおける「未解決問題」と成果検証の重要性
今回のGPT-5に関する騒動は、AIが「未解決問題」を解決したと主張する際の、その定義と成果検証の重要性を改めて浮き彫りにしました。数学の分野では、新たな発見や解決策は厳密な証明と査読プロセスを経て初めて認められます。AIが既存の文献を効率的に検索し、関連する情報を見つけ出す能力は高く評価されるべきですが、それを「新たな数学的発見」や「未解決問題の解決」と混同してはなりません。
国内のAI開発企業やAI導入を検討する組織にとっても、この事例は重要な教訓となります。AIシステムの能力を評価する際には、ベンチマークテストや発表内容を鵜呑みにせず、その根拠や検証方法を厳しく確認する必要があります。特に、誇大広告や過度な期待を煽るような情報には注意し、具体的なユースケースにおけるAIの現実的な貢献度を見極める視点が不可欠です。信頼性のあるAI技術の発展には、透明性と再現性のある成果検証が求められます。

