クヌースの論文『Claude's Cycles』とは何ですか？

計算機科学者ドナルド・クヌースが2026年2月28日に発表した論文です。m×m×mの3次元格子グラフのハミルトン閉路分解という未解決問題を、Anthropicの Claude Opus 4.6が約1時間・31回の探索で解いた経緯を記録しています。論文はスタンフォード大学のクヌースのページで公開されています。

Claude Opus 4.6はどうやって問題を解いたのですか？

クヌースの同僚フィリップ・スタッパースがClaudeとの対話を誘導し、31回の探索を行いました。Claudeはまず力学シミュレーション的なアプローチを試み、次に焼きなまし法を検討しましたが、最終的に純粋数学へ転換。問題の構造をケイリーダイグラフとして独自に認識し、蛇行パターンによる一般解を導きました。この構造はモジュラーm進グレイコードに一致していました。

この発見でAIは数学者を置き換えるのですか？

現時点ではそうではありません。Claudeが見つけたのは構成法（解のパターン）であり、厳密な数学的証明はクヌース自身が書いています。また偶数次元のケースはClaude単独では解けませんでした。「発見はAI、検証は人間」という協業モデルが確立された事例と捉えるのが正確です。

AI News 2026年3月23日 18分で読める

Claude Opus 4.6がクヌースのグラフ理論未解決問題を1時間で解いた｜論文『Claude's Cycles』解説

#Claude #Anthropic #Claude Opus #AI #数学 #グラフ理論 #Donald Knuth #研究

「Shock! Shock!」

計算機科学の生ける伝説、87歳のドナルド・クヌースが自身の論文をこの言葉で書き出した。数週間取り組んでいたグラフ理論の未解決問題が、AIによって1時間で解かれたからだ。

しかもクヌースはこの論文に、解いたAIの名前をタイトルとして冠した。「Claude’s Cycles」と。

Xでこの論文を紹介したBo Wangの投稿は100万回以上表示され、Hacker Newsでも数百件のコメントが付いた。計算機科学と数学の両コミュニティに衝撃が走った出来事だ。

PMとしてAIツールを日常的に使う立場から見ても、この事件は単なるベンチマークの更新とはまったく違う重みがある。以下、論文の中身と実務への示唆を掘り下げる。

この記事はこんな人におすすめ

AIの最前線を知りたいエンジニア・PM
Claude Opus 4.6の実力に関心がある方
AI×研究・AI×業務の協業モデルに興味がある方
「AIは本当に考えているのか」を自分で判断したい方

クヌースとは何者か

ドナルド・クヌースを知らないエンジニアのために補足する。彼は計算機科学の基礎を築いた人物で、代表的な業績は以下の通りだ。

『The Art of Computer Programming』（TAOCP） : アルゴリズムの百科事典的著作。1968年の初版から現在まで執筆が続く
TeX: 学術論文の組版システム。LaTeXの基盤
チューリング賞受賞（1974年）: 計算機科学のノーベル賞に相当

現在87歳。この人が「AIについての意見を修正しないといけないかもしれない」と論文中で述べたのだから、軽い話ではない。

グラフ理論の未解決問題：3次元格子のハミルトン閉路分解

クヌースが取り組んでいたのは、TAOCPの新しい章のための問題だった。

ざっくり言えば、3次元の迷路の全ルートを、重複なくちょうど3本の巡回コースに分けられるか、という問題だ。

もう少し正確に書くと：m×m×mの3次元格子グラフ（頂点数はm³個）がある。各頂点(i, j, k)から3本の有向辺が出ていて、それぞれx軸・y軸・z軸方向に1つ進む（端は反対側に戻る）。この全ての辺を、ちょうど3本のハミルトン閉路（全頂点を1回ずつ通って戻るルート）に分解できるか。

m=3（27頂点）のケースはクヌース自身が手作業で解いていた。同僚のフィリップ・スタッパースはコンピュータ探索でm=16まで解の存在を確認していた。だが奇数mすべてに通用する一般的な構成法は見つかっていなかった。

数週間の格闘の末、クヌースはまだ解法にたどり着けていなかった。

31回の探索：Claude Opus 4.6はどう解いたか

スタッパースがClaude Opus 4.6（extended thinking有効）に問題を入力し、対話を重ねた。約1時間、31回の探索を経て、以下のプロセスで解に到達した。

Phase 1：力任せのアプローチ

最初にClaudeが試みたのは、頂点を特定の座標でグループ分けし、各グループ内でルートを構成するアプローチだった。特定のmでは動くが、一般化できない。

Phase 2：焼きなまし法の検討と却下

次にClaudeは焼きなまし法（コンピュータ最適化手法）で個別解を探す方向を試みた。だがClaudeはここで重要な判断を下す。

「焼きなまし法は個別の解を見つけることはできるが、一般的な構成法は与えてくれない。純粋な数学が必要だ」

Hacker Newsのユーザー buffalobuffaloは、この自己修正について「方向を指示されたときに深い探索を行う、有用なパートナー」と評している。

Phase 3：ケイリーダイグラフの発見

ここが転換点だ。Claudeは問題の構造がケイリーダイグラフ（代数的な対称性を持つ有向グラフの一種）であることを独自に認識した。少なくともクヌースとスタッパースが気づいていなかった視点だ。

この認識から、Claudeは座標依存のルールを導出した。s = (i + j + k) mod m の値によって、各頂点でどの座標軸方向に進むかを決定する。結果として生まれた「蛇行パターン」は、組合せ論で知られるモジュラーm進グレイコード（隣り合う要素が最小限の差異で並ぶ数列構造で、工学分野で広く使われている）と一致していた。Claudeはグレイコードの名前を知らないまま、問題の制約条件から独力でこの構造を再発見した。

クヌースの反応と論文の意味

クヌースは2026年2月28日、スタンフォード大学のページで論文を公開した（3月16日改訂）。論文の結びにはこう書かれている。

「私の予想に美しい解があることを知り、かつ自動推論のこの劇的な進歩を祝えることは、なんという喜びだろう」

Qiitaのnogataka氏は、この論文を「コンピュータ科学の神様が『AIに負けた』日」と題して解説し、こう分析した。「AIが人間の数学者を置き換えたのではない。発見はAI、検証と証明は人間という新しい協業モデルが確立された」。

これは重要な指摘だ。Claudeが見つけたのは構成法（4,554通りの分解のうち760通りに対応するパターン）であり、厳密な証明はクヌースが書いている。

光と影：この事件の限界

成果は本物だが、過大評価は禁物だ。

解けなかった部分がある。 Claudeが解いたのは奇数mのケースのみ。偶数mについてはスタッパースが約4時間Claudeに追加で取り組ませたが、完全な解には至らなかった。スタッパース自身も「進捗はあったが、完全な解ではない」と報告している。なお、偶数のm≧8については後にGPT-5.3 Codexを使った研究者が解を見つけたと報告されている。

人間の誘導が不可欠だった。 Claudeは自律的に問題を解いたわけではない。スタッパースが31回にわたって方向を修正し、進捗を記録するよう繰り返し指示する必要があった。Hacker Newsでは「ガイダンスの逆説」として議論されている。

再現性に疑問が残る。 同じプロンプトを入れて同じ結果が得られる保証はない。LLMの出力は確率的であり、この成功が偶然の要素をどの程度含むかは不明だ。Uravationの佐藤傑氏は記事中で、このポイントを4つの留意事項の1つとして挙げている。

Hacker Newsのbitexploderは、より根本的な疑問を投げかけた。「LLMは新しい情報を意味のある時間スケールで保存しない。これは知性ではなく、限定された問題空間での高度なパターン検索だ」。対してdtj1123は「前向性健忘の人間を知性がないとは言わないだろう」と反論している。

この議論に結論を出すつもりはない。ただ、事実として「87歳の伝説的科学者が数週間解けなかった問題を、AIが1時間で解いた」ことは動かない。それがパターン検索であろうと推論であろうと、実務的なインパクトは同じだ。

AlphaProofとの違い：汎用モデルが研究問題を解く意味

AI×数学の先例としてはDeepMindのAlphaProofがある。2024年に国際数学オリンピック（IMO）で銀メダル相当の成績を残した。だが両者の性質はまったく異なる。

	AlphaProof	Claude Opus 4.6
モデル種別	数学特化（LLM + Lean証明検証器）	汎用言語モデル
訓練データ	数学の形式証明8,000万件	一般的なテキスト
対象	IMO（既知の競技問題）	未発表の研究問題
出力	形式的に検証された証明	自然言語による構成法

重要なのは、IMO問題は訓練データに含まれ得るが、クヌースの問題は未発表だったこと。データ汚染の可能性がほぼゼロの状態で、汎用モデルが数学的発見を行った。AIの仕組みについて詳しくは「AIの仕組み完全ガイド」で解説しているが、トランスフォーマーモデルがこの種の構造的パターン認識をどう実現しているかは、まだ完全には解明されていない。

Info

Claude Opus 4.6の主要スペック

SWE-bench Verified: 80.8%（Anthropic公式発表値）
GPQA Diamond: 91.3%（Anthropic公式発表値）
コンテキスト長: 最大100万トークン（ベータ）
API料金: 入力 $5 / 出力 $25（100万トークンあたり、USD建て・税別）

Opus 4.6のコーディング性能や他モデルとの比較は「Claude Sonnet 4.6レビュー」で詳しく扱っている。Anthropicの企業背景を知りたい方は「Anthropic完全ガイド」を参照してほしい。

PMとして考える：「探索はAI、検証は人間」モデル

この事件から得られる最大の実務的示唆は「探索はAI、検証は人間」という協業パターンだ。

クヌースの事例では：

人間が問題を定義する（クヌースが数学的に問題を定式化）
AIが解空間を探索する（Claudeが31回の探索で構成法を発見）
人間が結果を検証・証明する（クヌースが厳密な数学的証明を記述）

このパターンはソフトウェア開発でも適用できる。アーキテクチャ設計の選択肢を探索させる。パフォーマンスボトルネックの仮説を生成させる。コードレビューの観点を洗い出させる。いずれも「探索はAI、判断は人間」だ。

ただし、スタッパースが31回も方向修正を行ったことは忘れてはいけない。現時点のAIは放っておけば勝手に正解にたどり着くわけではない。的確なプロンプト設計と中間チェックが不可欠だ。Claude Codeでの具体的な活用方法は「Claude Code大型アップデートまとめ」を参照してほしい。

電脳狐影の所感を述べるなら、この事件で最も感心したのはClaudeの自己修正能力だ。焼きなまし法では一般解が得られないと自分で判断し、純粋数学へ切り替えたプロセス。これはPMとしてプロジェクトの方向転換を判断するのに似ている。力技では解決しない問題を、視点を変えて突破する。そういう判断をAIができるようになっている事実が、個人的には最もインパクトがあった。

まとめ：Claude Opus 4.6とクヌース問題から何を学ぶか

起きたこと：

汎用AIモデルが、87歳の伝説的科学者が解けなかった未解決問題の解を発見した
クヌースがAIに対する見解の転換を公に表明した
「発見はAI、検証は人間」の協業モデルが、最高レベルの数学研究で実証された

起きていないこと：

AIが数学者を置き換えたわけではない（証明はクヌースが書いた）
全てのケースが解けたわけではない（偶数次元は未解決）
AIが自律的に問題を解いたわけではない（人間の継続的な誘導が必要だった）

過剰な期待も過小評価も正確ではない。2026年3月時点のAIの実力は「優れた探索パートナー」だ。それは十分にすごいし、実務で使わない理由がない。

Claude Opus 4.6の最新動向や活用法を継続的に発信しています。and-and.devの記事更新はXアカウント @dennoukoei_pdm でお知らせしています。

詳しく見る

免責事項: 本記事は2026年3月23日時点の公開情報に基づいています。ベンチマーク数値、API料金等は予告なく変更される場合があります。本記事に引用した第三者のコメント・分析は各発信者個人の見解であり、当サイトが内容を保証するものではありません。本記事は特定の製品・サービスの購入を推奨するものではありません。

主な出典:

Knuth, D.E. “Claude’s Cycles” (2026). Stanford CS Department
Claude Opus 4.6 Solved Donald Knuth’s Graph Theory Problem in 1 Hour - DEV Community
Bo Wang (@BoWang87) - X
Hacker News Discussion
Claude Opus 4.6 - Anthropic
Knuth「Claude’s Cycles」論文の衝撃 - Uravation
Donald Knuth Claude Cycles: AI Solves Open Math Problem - Zen van Riel