23歳の青年がGPT-5.4 Proでエルデシュ問題1196を解決、AIが数学の新時代を切り開く

23歳のLiam PriceがChatGPTにエルデシュ問題を入力。わずか80分で1966年以来未解決の問題#1196に解を提供。Terrence Tao博士が確認し、AIと人間の協力が数学革命を示唆する。
問題#1196とは何か?
エルデシュ問題#1196は整数集合の振る舞いを扱う。原始集合とは、互いに割り切れない整数群を指す。
集合内の数が非常に大きくなるときの特定の和の挙動を分析。1966年以来未解決だった。
どのように発見されたか?
Liam Priceは数学の専門教育なし。エルデシュ問題ウェブサイトからランダムに問題を選択。
ChatGPT(GPT-5.4 Pro)に入力。80分で解を生成。
友人が検証。Terrence Taoが確認した。
従来アプローチとAIの違いは?
StanfordのJared Lichtmanは長年取り組んだが部分進展のみ。von Mangoldt関数を使わず。
GPT-5.4 Proはvon Mangoldt関数を活用。Riemannゼータ関数と関連。
Lichtman氏:「LLMは完全に異なるルートを取った」。
AI貢献の現実と限界
出力は「かなり貧弱」とLichtman氏。評価したが専門家が解釈必要。
TaoのGitHubリポジトリで人間-AI協力解決と分類。
- 完全AI解決:緑(3件)
- 部分進展:黄(14件)
- 失敗:赤(8件)
失敗報告は少ないため成功バイアス存在。
過去の論争事例は?
OpenAIのSebastien BubeckがGPT-5で複数解決主張。削除。
DeepMindCEO Demis Hassabisが「恥ずべき」と批判。既知解をウェブから取得しただけ。
AIの数学解決能力をどう測る?
2026年2月、First Proofイニシアチブ開始。11人の数学者が10問題提供。
AIに1週間与え、訓練データ外の問題。自主解決は未達。
| 分類 | 内容 |
|---|---|
| 問題数 | 10 |
| 時間制限 | 1週間 |
| 結果 | 自主解決なし |
なぜAIは成功したのか?
Tao博士:数学コミュニティの集団的ブロックを回避。伝統的出発点に縛られず。
AIの「無知」が利点。新規アプローチを生んだ。
FAQ:AIと数学の未来
- 問題#1196はAI単独解決か? いいえ、人間-AI協力。
- 他のエルデシュ問題のAI成功率は? 完全解決3件中、多くは部分進展。
- 今後の影響は? 非伝統的アプローチの有効性検証中。





