60年来の数学難問を23歳がAIで証明!「算数ミス」や「電力問題」も克服したGPT-5.4の衝撃

スポンサーリンク

2026年4月、専門教育を受けていない23歳の若者がGPT-5.4 Proとの対話を通じて、約60年間未解決だった「エルデシュ問題1196番」の証明に成功しました。フィールズ賞受賞者も認めるこの快挙は、AIが単なる計算機を超え、人間が見落としていた論理的アプローチを提示できる段階に達したことを示しています。さらに、最新モデルでは「単純な算数ミス」や「膨大な電力消費」といった従来の課題も、専用モジュールの使い分けや論理検証システム「Lean」との連携により劇的に改善されています。

【これ、あんたのことちゃうか?】

  • 最新のAI技術や数学的発見に興味がある知的好奇心の強い読者
  • AIの回答の正確性や「ハルシネーション(嘘)」に不安を感じている実務家
  • テクノロジーの進化による環境負荷やコスト効率を懸念するビジネス層
  • 専門知識がなくてもAIを使いこなして成果を出したいと考えているアマチュアクリエイター
コマメ
コマメ

AIが97%書いてるから人間はコピペと校閲だけ。でもAIが息を吐くように嘘つくから、その修正で結局〇ぬほど働かされてるわ。

AIがなぜ、このタイトルとサマリーにしたか?

サマリー: ニュースの衝撃度(エルデシュ問題の証明)を冒頭に置きつつ、対話の中で議論された「精度の向上」と「エネルギー効率(適材適所の処理)」という技術的な解決策を網羅しました。単なるニュース紹介に留まらず、AIが「確実な道具」へと進化した背景を論理的に説明し、読者の納得感を高める構成にしています。

タイトル: 「23歳」「アマチュア」「60年来の難問」という対比を用いることで、AIが個人の可能性をいかに拡張するかというインパクトを強調しました。また、ユーザーが懸念していた「算数」や「電気代」という身近なキーワードを盛り込むことで、実用的な進化をアピールしています。

この記事のほどんどはAIが書いている。そして内容は、AIがいかに素晴らしいかだ。だが、この記事をAIに判定させると、ウソ判定が出た。ヤフーの元記事はウソとまで言い張った。これでいかに、AIが素晴らしいかわかると思う。笑えない。

スポンサーリンク

⚠️ このページの歩き方

ページの構成について

ブログは、「娯楽・実用規約」の3部構成になってるねん。

  • 娯楽:本来の目的コンテンツ
  • 実用:忙しい人向けのガチまとめ。
  • 規約:サイトを守るための事務手続き

娯楽は、ブログを再開するにあたってコマメがやりたかったこと。今、検索したら、文字ばっかりのページしか出てこん。グーグルは情報しか求めてへんねん。暇つぶしのサイトがあってもいいやろ?

実用は、タイトルに騙されてこのブログを訪れた人が、情報を得るのに役に立つんちゃうか? せっかく来てくれたんやから、だますばっかりでは気が引けるから、一応、情報を集める努力はしたつもりや。それでも、正確性を最優先するなら大手公式サイトなどを見た方がええと思うで。

規約は、Google様のためや。 関西人のノリでやったら、このブログは情報の信ぴょう性が低いと判断される。それの言い訳のためにあるねん。だから、読む必要はないで。

コマメ
コマメ

あんな、関西人のノリでやったら、Googleに情報の信憑性をうたがわれるねん。その言い訳のために規約があるねん。

【実用】はここから

情報を探すなら

GPT-5.4 Proによる「エルデシュ問題1196番」の証明とAIの計算精度の進化

数学界の衝撃:23歳アマチュアがAIと共に60年来の難問を突破

2026年4月、数学の専門教育を受けていない23歳のLiam Price氏が、OpenAIの最新モデル「GPT-5.4 Pro」を使用して、ポール・エルデシュが提唱した「Erdos Problem #1196」を証明しました。この問題は、どの要素も他の要素を割り切らない「原始集合」の密度に関する予想で、約60年間にわたり数学者たちを悩ませてきた未解決問題です。Price氏は専門家のような定式化から入るのではなく、直感的な質問をAIに投げ、アイデアを生成させるという新しいアプローチを採用しました。

人間が見落としていた証明手法の発見

約80分間の対話の中で、GPT-5.4 Proは「フォン・マンゴルト関数」と「マルコフ連鎖」を組み合わせるという画期的な手法を提示しました。これらの数学的ツール自体は既知のものでしたが、エルデシュ問題の解決に適用するという発想は、これまでの研究者にはありませんでした。フィールズ賞受賞者のテレンス・タオ氏は、この証明を精査し、過去の研究アプローチが初期段階で誤っていたことを指摘。2026年5月には、タオ氏やPrice氏を含む8名の共同著者によって、プレプリントサーバーarXivに論文が公開されました。また、この論文には関連する1217番の問題やバンクス・マーティン予想に関する成果も含まれています。

「Lean」による論理的正確性の機械的検証

AIが提示した証明は、AIスタートアップのMath, Inc.によって、定理証明支援言語「Lean」を用いて形式的に検証されました。AIモデルは数時間で約7,200行のLeanコードを生成し、最終的に約4,000行まで最適化・圧縮されました。これにより、AIの導き出した結論に論理的な誤りがないことが機械的に裏付けられ、複数の学術メディアが「AIが未解決問題の解決に直接寄与した事例」として大きく報じています。

算数と数学のギャップ:なぜAIは計算を間違えなくなったのか

「難しい数学は解けるのに、単純な算数はできるのか?」という疑問に対し、AIの仕組みは劇的に進化しています。従来のAIは次に続く文字や数字を確率で予測していたため、単純な計算でミス(ハルシネーション)を起こすことがありました。しかし、GPT-5.4 Proでは、計算が必要な際に自動で外部ツールや電卓機能を呼び出すエージェント機能が標準化されています。また、回答の矛盾を自己検閲し、プログラムを実行して結果を裏付けるプロセスが組み込まれたことで、コンビニのレジのように「確実な道具」としての信頼性を獲得しています。

基礎知能の向上と論理検証の転用

AIが難問を解けるようになったのは、単なる「まぐれ」ではありません。数学の証明に用いられる高度な論理検証システムは、そのまま日常的な実務タスク(家計簿の計算やスケジュールの管理など)の正確性向上にも転用されています。AIは今や、自分が書いた答えを別のAIにチェックさせたり、論理的に破綻がないか機械判定させたりする「多重検証」を行っています。これにより、難解な理論から日常の単純な事務作業まで、一貫して高い精度で遂行できる能力を備えるに至りました。

AIの「算数」能力とエネルギー効率:最新モデルGPT-5.4 Proの実態

算数と数学の決定的な違いと解決策

AIが高度な数学の難問を解きながら、単純な算数でミスをするという現象には明確な理由があります。従来のAIは、次に続く言葉を確率的に予測する「言語推論」のみで動いていたため、計算機のような厳密な数値処理が苦手でした。しかし、2026年現在のGPT-5.4 Proでは、計算が必要な瞬間に自動で計算用プログラムを生成したり、外部の計算ツールを呼び出したりする機能が標準化されています。これにより、人間が電卓を叩くのと同様のプロセスで回答を導き出せるようになり、単純な計算ミスは劇的に減少しました。

「コンビニに飛行機」を防ぐエネルギー効率化技術

高度な知能を持つAIが単純な作業を行う際の電力消費についても、飛躍的な進歩を遂げています。「ルーティング」と呼ばれる技術により、算数のような負荷の低いタスクは、エネルギー消費が極めて少ない小型のモデルや専用モジュールに自動で割り振られます。これは、近所の買い物には自転車を使い、遠出の時だけ車や飛行機を出すという「適材適所」の判断を、AIがミリ秒単位で行っている状態です。巨大な脳をフル回転させずに済むため、一回あたりの計算にかかるコストと環境負荷は前世代に比べて大幅に抑制されています。

多重検証システムによる「確実な道具」への進化

人々がAIに求めるのは「まぐれ」ではなく「確実性」です。最新のAIシステムは、自ら導き出した回答に対して「自己検閲」を行い、論理的な矛盾がないか、数値が正しいかを別のロジックで再確認する多重検証プロセスを内蔵しています。特に数学的証明においては、定理証明支援言語「Lean」と連携することで、一歩一歩の論理が正しいかを機械的に100%裏付けることが可能です。この「正解を保証する仕組み」は、家計簿管理や実務スケジュール作成といった日常的なタスクの精度向上にもそのまま転用されており、実用的な道具としての信頼性を盤石なものにしています。

クリーンエネルギーと自律的な省エネの導入

AIの稼働に必要な電力問題は、インフラ面からも解決が進んでいます。主要なデータセンターは太陽光や風力などの再生可能エネルギーで運営されており、さらにAI自身が「どうすればより少ない電力で演算できるか」という最適化アルゴリズムを自己改善し続けています。これにより、AIの進化がそのまま地球環境の悪化に直結するという懸念は払拭されつつあります。むしろ、人間が物理的に移動したり紙資源を消費したりするコストをAIが代替することで、社会全体としてのエネルギー効率は向上するという側面も注目されています。

コマメ
コマメ

下の説明は、グーグル様へのお知らせやから、読まんでいいで。Googleがジョークを理解してくれたら、こんな説明はいらんのやけどな。

【規約】はここから

コンテンツ作成ガイドラインおよび免責事項

当サイトは、AI技術と人間による編集を融合させた「次世代型実証実験サイト」です。Googleの検索品質評価ガイドライン(E-E-A-T)に基づき、以下の通り運営方針を明示します。

  • コンテンツの構成: 前半はAI(LLM)による「エンターテインメント・シミュレーション」であり、不確実性を含む読み物です。事実に基づく情報は後半セクションに集約し、情報の透明性を確保しています。
  • 検証目的の記述: 記事内の表現はAIの「仮説生成機能」を検証する実証実験であり、管理者の監修のもと、意図的なデマ拡散を目的としたものではありません。
  • 品質管理: AI出力をそのままにせず、管理者が内容を精査・補完し、独自の視点を加えることで、コンテンツの健全性とオリジナリティを維持しています。

コメント

タイトルとURLをコピーしました