Claude Opus 4.6がクヌースのグラフ理論未解決問題を1時間で解いた|論文『Claude's Cycles』解説
「Shock! Shock!」
計算機科学の生ける伝説、87歳のドナルド・クヌースが自身の論文をこの言葉で書き出した。数週間取り組んでいたグラフ理論の未解決問題が、AIによって1時間で解かれたからだ。
しかもクヌースはこの論文に、解いたAIの名前をタイトルとして冠した。「Claude’s Cycles」と。
Xでこの論文を紹介したBo Wangの投稿は100万回以上表示され、Hacker Newsでも数百件のコメントが付いた。計算機科学と数学の両コミュニティに衝撃が走った出来事だ。
PMとしてAIツールを日常的に使う立場から見ても、この事件は単なるベンチマークの更新とはまったく違う重みがある。以下、論文の中身と実務への示唆を掘り下げる。
- AIの最前線を知りたいエンジニア・PM
- Claude Opus 4.6の実力に関心がある方
- AI×研究・AI×業務の協業モデルに興味がある方
- 「AIは本当に考えているのか」を自分で判断したい方
クヌースとは何者か
ドナルド・クヌースを知らないエンジニアのために補足する。彼は計算機科学の基礎を築いた人物で、代表的な業績は以下の通りだ。
- 『The Art of Computer Programming』(TAOCP) : アルゴリズムの百科事典的著作。1968年の初版から現在まで執筆が続く
- TeX: 学術論文の組版システム。LaTeXの基盤
- チューリング賞受賞(1974年): 計算機科学のノーベル賞に相当
現在87歳。この人が「AIについての意見を修正しないといけないかもしれない」と論文中で述べたのだから、軽い話ではない。
グラフ理論の未解決問題:3次元格子のハミルトン閉路分解
クヌースが取り組んでいたのは、TAOCPの新しい章のための問題だった。
ざっくり言えば、3次元の迷路の全ルートを、重複なくちょうど3本の巡回コースに分けられるか、という問題だ。
もう少し正確に書くと:m×m×mの3次元格子グラフ(頂点数はm³個)がある。各頂点(i, j, k)から3本の有向辺が出ていて、それぞれx軸・y軸・z軸方向に1つ進む(端は反対側に戻る)。この全ての辺を、ちょうど3本のハミルトン閉路(全頂点を1回ずつ通って戻るルート)に分解できるか。
m=3(27頂点)のケースはクヌース自身が手作業で解いていた。同僚のフィリップ・スタッパースはコンピュータ探索でm=16まで解の存在を確認していた。だが奇数mすべてに通用する一般的な構成法は見つかっていなかった。
数週間の格闘の末、クヌースはまだ解法にたどり着けていなかった。
31回の探索:Claude Opus 4.6はどう解いたか
スタッパースがClaude Opus 4.6(extended thinking有効)に問題を入力し、対話を重ねた。約1時間、31回の探索を経て、以下のプロセスで解に到達した。
Phase 1:力任せのアプローチ
最初にClaudeが試みたのは、頂点を特定の座標でグループ分けし、各グループ内でルートを構成するアプローチだった。特定のmでは動くが、一般化できない。
Phase 2:焼きなまし法の検討と却下
次にClaudeは焼きなまし法(コンピュータ最適化手法)で個別解を探す方向を試みた。だがClaudeはここで重要な判断を下す。
「焼きなまし法は個別の解を見つけることはできるが、一般的な構成法は与えてくれない。純粋な数学が必要だ」
Hacker Newsのユーザー buffalobuffaloは、この自己修正について「方向を指示されたときに深い探索を行う、有用なパートナー」と評している。
Phase 3:ケイリーダイグラフの発見
ここが転換点だ。Claudeは問題の構造がケイリーダイグラフ(代数的な対称性を持つ有向グラフの一種)であることを独自に認識した。少なくともクヌースとスタッパースが気づいていなかった視点だ。
この認識から、Claudeは座標依存のルールを導出した。s = (i + j + k) mod m の値によって、各頂点でどの座標軸方向に進むかを決定する。結果として生まれた「蛇行パターン」は、組合せ論で知られるモジュラーm進グレイコード(隣り合う要素が最小限の差異で並ぶ数列構造で、工学分野で広く使われている)と一致していた。Claudeはグレイコードの名前を知らないまま、問題の制約条件から独力でこの構造を再発見した。
クヌースの反応と論文の意味
クヌースは2026年2月28日、スタンフォード大学のページで論文を公開した(3月16日改訂)。論文の結びにはこう書かれている。
「私の予想に美しい解があることを知り、かつ自動推論のこの劇的な進歩を祝えることは、なんという喜びだろう」
Qiitaのnogataka氏は、この論文を「コンピュータ科学の神様が『AIに負けた』日」と題して解説し、こう分析した。「AIが人間の数学者を置き換えたのではない。発見はAI、検証と証明は人間という新しい協業モデルが確立された」。
これは重要な指摘だ。Claudeが見つけたのは構成法(4,554通りの分解のうち760通りに対応するパターン)であり、厳密な証明はクヌースが書いている。
光と影:この事件の限界
成果は本物だが、過大評価は禁物だ。
解けなかった部分がある。 Claudeが解いたのは奇数mのケースのみ。偶数mについてはスタッパースが約4時間Claudeに追加で取り組ませたが、完全な解には至らなかった。スタッパース自身も「進捗はあったが、完全な解ではない」と報告している。なお、偶数のm≧8については後にGPT-5.3 Codexを使った研究者が解を見つけたと報告されている。
人間の誘導が不可欠だった。 Claudeは自律的に問題を解いたわけではない。スタッパースが31回にわたって方向を修正し、進捗を記録するよう繰り返し指示する必要があった。Hacker Newsでは「ガイダンスの逆説」として議論されている。
再現性に疑問が残る。 同じプロンプトを入れて同じ結果が得られる保証はない。LLMの出力は確率的であり、この成功が偶然の要素をどの程度含むかは不明だ。Uravationの佐藤傑氏は記事中で、このポイントを4つの留意事項の1つとして挙げている。
Hacker Newsのbitexploderは、より根本的な疑問を投げかけた。「LLMは新しい情報を意味のある時間スケールで保存しない。これは知性ではなく、限定された問題空間での高度なパターン検索だ」。対してdtj1123は「前向性健忘の人間を知性がないとは言わないだろう」と反論している。
この議論に結論を出すつもりはない。ただ、事実として「87歳の伝説的科学者が数週間解けなかった問題を、AIが1時間で解いた」ことは動かない。それがパターン検索であろうと推論であろうと、実務的なインパクトは同じだ。
AlphaProofとの違い:汎用モデルが研究問題を解く意味
AI×数学の先例としてはDeepMindのAlphaProofがある。2024年に国際数学オリンピック(IMO)で銀メダル相当の成績を残した。だが両者の性質はまったく異なる。
| AlphaProof | Claude Opus 4.6 | |
|---|---|---|
| モデル種別 | 数学特化(LLM + Lean証明検証器) | 汎用言語モデル |
| 訓練データ | 数学の形式証明8,000万件 | 一般的なテキスト |
| 対象 | IMO(既知の競技問題) | 未発表の研究問題 |
| 出力 | 形式的に検証された証明 | 自然言語による構成法 |
重要なのは、IMO問題は訓練データに含まれ得るが、クヌースの問題は未発表だったこと。データ汚染の可能性がほぼゼロの状態で、汎用モデルが数学的発見を行った。AIの仕組みについて詳しくは「AIの仕組み完全ガイド」で解説しているが、トランスフォーマーモデルがこの種の構造的パターン認識をどう実現しているかは、まだ完全には解明されていない。
Claude Opus 4.6の主要スペック
- SWE-bench Verified: 80.8%(Anthropic公式発表値)
- GPQA Diamond: 91.3%(Anthropic公式発表値)
- コンテキスト長: 最大100万トークン(ベータ)
- API料金: 入力 $5 / 出力 $25(100万トークンあたり、USD建て・税別)
Opus 4.6のコーディング性能や他モデルとの比較は「Claude Sonnet 4.6レビュー」で詳しく扱っている。Anthropicの企業背景を知りたい方は「Anthropic完全ガイド」を参照してほしい。
PMとして考える:「探索はAI、検証は人間」モデル
この事件から得られる最大の実務的示唆は「探索はAI、検証は人間」という協業パターンだ。
クヌースの事例では:
- 人間が問題を定義する(クヌースが数学的に問題を定式化)
- AIが解空間を探索する(Claudeが31回の探索で構成法を発見)
- 人間が結果を検証・証明する(クヌースが厳密な数学的証明を記述)
このパターンはソフトウェア開発でも適用できる。アーキテクチャ設計の選択肢を探索させる。パフォーマンスボトルネックの仮説を生成させる。コードレビューの観点を洗い出させる。いずれも「探索はAI、判断は人間」だ。
ただし、スタッパースが31回も方向修正を行ったことは忘れてはいけない。現時点のAIは放っておけば勝手に正解にたどり着くわけではない。的確なプロンプト設計と中間チェックが不可欠だ。Claude Codeでの具体的な活用方法は「Claude Code大型アップデートまとめ」を参照してほしい。
電脳狐影の所感を述べるなら、この事件で最も感心したのはClaudeの自己修正能力だ。焼きなまし法では一般解が得られないと自分で判断し、純粋数学へ切り替えたプロセス。これはPMとしてプロジェクトの方向転換を判断するのに似ている。力技では解決しない問題を、視点を変えて突破する。そういう判断をAIができるようになっている事実が、個人的には最もインパクトがあった。
まとめ:Claude Opus 4.6とクヌース問題から何を学ぶか
起きたこと:
- 汎用AIモデルが、87歳の伝説的科学者が解けなかった未解決問題の解を発見した
- クヌースがAIに対する見解の転換を公に表明した
- 「発見はAI、検証は人間」の協業モデルが、最高レベルの数学研究で実証された
起きていないこと:
- AIが数学者を置き換えたわけではない(証明はクヌースが書いた)
- 全てのケースが解けたわけではない(偶数次元は未解決)
- AIが自律的に問題を解いたわけではない(人間の継続的な誘導が必要だった)
過剰な期待も過小評価も正確ではない。2026年3月時点のAIの実力は「優れた探索パートナー」だ。それは十分にすごいし、実務で使わない理由がない。
Claude Opus 4.6の最新動向や活用法を継続的に発信しています。and-and.devの記事更新はXアカウント @dennoukoei_pdm でお知らせしています。
免責事項: 本記事は2026年3月23日時点の公開情報に基づいています。ベンチマーク数値、API料金等は予告なく変更される場合があります。本記事に引用した第三者のコメント・分析は各発信者個人の見解であり、当サイトが内容を保証するものではありません。本記事は特定の製品・サービスの購入を推奨するものではありません。
主な出典:
- Knuth, D.E. “Claude’s Cycles” (2026). Stanford CS Department
- Claude Opus 4.6 Solved Donald Knuth’s Graph Theory Problem in 1 Hour - DEV Community
- Bo Wang (@BoWang87) - X
- Hacker News Discussion
- Claude Opus 4.6 - Anthropic
- Knuth「Claude’s Cycles」論文の衝撃 - Uravation
- Donald Knuth Claude Cycles: AI Solves Open Math Problem - Zen van Riel