23歳の青年がGPT-5.4 Proでエルデシュ問題1196を解決、AIが数学の新時代を切り開く

23歳のLiam PriceChatGPTにエルデシュ問題を入力。わずか80分で1966年以来未解決の問題#1196に解を提供。Terrence Tao博士が確認し、AIと人間の協力が数学革命を示唆する。

問題#1196とは何か?

エルデシュ問題#1196は整数集合の振る舞いを扱う。原始集合とは、互いに割り切れない整数群を指す。

集合内の数が非常に大きくなるときの特定の和の挙動を分析。1966年以来未解決だった。

どのように発見されたか?

Liam Priceは数学の専門教育なし。エルデシュ問題ウェブサイトからランダムに問題を選択。

ChatGPTGPT-5.4 Pro)に入力。80分で解を生成。

友人が検証。Terrence Tao確認した。

従来アプローチとAIの違いは?

StanfordJared Lichtmanは長年取り組んだが部分進展のみ。von Mangoldt関数を使わず。

GPT-5.4 Provon Mangoldt関数を活用。Riemannゼータ関数と関連。

Lichtman氏:「LLMは完全に異なるルートを取った」。

AI貢献の現実と限界

出力は「かなり貧弱」とLichtman氏。評価したが専門家が解釈必要。

TaoのGitHubリポジトリ人間-AI協力解決と分類。

  • 完全AI解決:緑(3件)
  • 部分進展:黄(14件)
  • 失敗:赤(8件)

失敗報告は少ないため成功バイアス存在。

過去の論争事例は?

OpenAISebastien BubeckがGPT-5で複数解決主張。削除

DeepMindCEO Demis Hassabisが「恥ずべき」と批判。既知解をウェブから取得しただけ。

AIの数学解決能力をどう測る?

2026年2月、First Proofイニシアチブ開始。11人の数学者が10問題提供。

AIに1週間与え、訓練データ外の問題。自主解決は未達。

分類内容
問題数10
時間制限1週間
結果自主解決なし

なぜAIは成功したのか?

Tao博士:数学コミュニティの集団的ブロックを回避。伝統的出発点に縛られず。

AIの「無知」が利点。新規アプローチを生んだ。

FAQ:AIと数学の未来

  • 問題#1196はAI単独解決か? いいえ、人間-AI協力。
  • 他のエルデシュ問題のAI成功率は? 完全解決3件中、多くは部分進展。
  • 今後の影響は? 非伝統的アプローチの有効性検証中。
Anzai Hotaka

10 年の経験を持つコンピュータ エンジニア。Linux コンピュータ システム管理者、Web プログラマー、システム エンジニア。