Anthropicが言う『再帰的自己改良』とは何ですか？

AIシステムが、人間の介入を最小限にしながら自分の後継モデルを設計・訓練できるようになる段階を指します。Anthropic自身は『まだ到達していない』『不可避でもない』としつつ、社内ではClaudeに訓練レシピの提案や失敗分析を任せ始めており、その閾値が想定より早く来る可能性があると論考で警告しています。

Claudeが社内コードの80%を書いているというのは本当ですか？

Anthropic公式の論考『When AI builds itself』（2026年6月4日公開）に記載された数値です。2026年5月時点でAnthropicの本番コードベースにマージされたコードのうち80%以上がClaude（Claude Code）製で、Claude Code公開前の2025年2月時点では1桁台だったとされます。第三者の独立検証ではなく社内データである点には注意が必要です。

Anthropicが求めている『一時停止』はすぐに発動されますか？

いいえ。論考自身が『単独で動くことは求めない』と明記しており、複数の最先端ラボが複数国にわたって同じ条件で同意した場合のみ意味を持つとされています。実効性のある仕組みはまだ存在せず、提案段階の議論です。

この発信は本当にAI安全のためですか？それともポジショントークですか？

両方の見方があります。CNNやScientific Americanは安全研究の延長線上として報じる一方、TechRadarやDecryptは『IPO直前のポジショントーク』『規制を作って自社の堀にしたい』という批判を紹介しています。本記事は両論を併記したうえで、PMとしての判断を最後に書いています。

AI News 2026年6月6日 27分で読める

Anthropic「Claudeが社内コード80%を書いている」AIにブレーキを求めた論考の中身

#Anthropic #Claude #AI Safety #recursive self-improvement #AIガバナンス #IPO

この記事はこんな人におすすめ

Claude / Claude Codeを業務で使っているフリーランスエンジニア
AIが自分の仕事を「どこまで」やるのか、現実的な肌感が欲しい方
IPO直前のAnthropicが何を狙っているのかを冷静に評価したいPM・経営者

「They want to build a moat」。TechRadarがAnthropicの新しい論考に対する一部の反応を見出しにそう書いた（TechRadar）。直訳すれば「彼らは堀を作りたいだけだ」。Anthropic自身がAIにブレーキを求めはじめた数日後の批評である。

2026年6月4日、Anthropicの内部研究機関は「When AI builds itself」と題した論考を公開した。共著者はMarina FavaroとJack Clark。要点は2つだ。1つは、2026年5月時点でAnthropicの本番コードベースにマージされたコードのうち80%以上をClaudeが書いているという内部データの開示。もう1つは、世界規模で「フロンティアAI開発を協調的にスローダウン、または一時停止する選択肢」を制度として持つべきだ、という政策提案である（Fortune、CNN）。

論考はその日のうちにHacker Newsのトップに上がり、本記事執筆時点で500ポイント超、コメントは600件超まで伸びている（Hacker News）。反応は割れている。「年内のAI論考で最も重要」と書く人もいれば、「ただのツール改善であってパラダイムシフトではない」と切り捨てる人もいる。

本記事の射程を最初に書いておく。論考の中身（80%・8倍・1/1000の数字）、再帰的自己改良（recursive self-improvement、以下RSI＝AIがAIを設計・訓練できる段階）の閾値論、IPO直前というタイミングへの批判、そしてフリーランスや小規模チームの実務に何が効くのか、を順に整理する。

何が公開されたのか：3つの核心データ

論考の主張は感情的な警鐘ではなく、自社の生産性データに紐づけて構成されている。まず数字を3つ押さえる。

1. Claudeが社内コードの80%以上を書いた

2026年5月時点でAnthropicの本番コードベースにマージされたコードのうち80%超がClaude（実質的にClaude Code）製、というのが論考の中心的な数字だ（Tom’s Hardware、VentureBeat）。Claude Codeが公開された2025年2月時点では1桁台だったとされる。1年強で1桁台から80%まで一気に動いている。

「コードを書く」の定義に注意がいる。Anthropicが言うのは「マージされたコードのうちClaudeが起案した行の比率」であり、レビュー・修正・最終承認は依然として人間のエンジニアが担っている。GitHubのco-authored-byが誰になっているかを集計したものではない点は論考でも触れられている。

2. 1人あたりのコード生産量は8倍、自己評価では4倍

別の内部指標として、Q2 2026のAnthropicエンジニアが1日あたりにマージするコード量は、コーディングエージェント導入前（2024年）の8倍にまで増えた、と論考は記している（Statesman）。

ただし論考自身が「これは過大評価の可能性が高い」と注釈している。社内アンケートでの研究者の自己申告は中央値4倍程度で、過去研究で知られた「開発者は自分のAI活用効果を実際より大きく見積もる」というバイアスが入っているはずだ、と。

3. 1件の最適化が「人間4年分」になった事例

具体的に目を引いたのは、2026年4月の社内事例だ。Claudeが800件超のパッチを連続して投入し、ある特定クラスのAPIエラーを1/1000まで減らした。担当エンジニアの推定では人間がやれば4年かかる規模、と論考は書いている（VentureBeat、Anthropic内部データ、第三者検証なし）。さらに「Mythos Preview」と呼ばれる社内向けの非公開モデルが、コード最適化タスクで約52倍の高速化を達成したとも記載がある（Scientific American）。

論考全体に通底するのは、「AI開発のボトルネックがコードを書く速度ではなく、人間がレビューできる速度に移った」という観察である。

数字に対するAnthropic自身の留保

論考はXで「これらの数字は再帰的自己改良の到来を保証するものではない」「Claudeに『どの問題に取り組むべきかを選ぶ研究判断（research judgment）』があるかはまだ不明だ」とも明言している。社内データの開示と、結論の控えめさが同居している点が、論考の評価を分けている。

「recursive self-improvement」が意味するもの

タイトルにある再帰的自己改良（recursive self-improvement、以下RSI）は、PMの目線では理解しておきたい概念だ。

RSIとは、あるAIシステムが、人間の関与を最小限にしながら自分の後継モデルを設計・訓練できる状態を指す。コードを書くだけでなく、訓練レシピの提案、評価の設計、失敗モードの分析、そしてそれらの結果を次世代モデルにフィードする、というループが回り続ける状態だ（Axios）。

Anthropicは「まだRSIには到達していない」「不可避でもない」と言いつつ、社内パイプラインでは既にClaudeが研究の補助的な役割を超えて、「監督層」としての人間に対する「実行エンジン」のような位置に移りつつあると書く（Scientific American）。

PMとして気になるのは、「この閾値を超えた瞬間、外から見て同じに見えるか」という点だ。論考の表現を借りれば、「ある日突然、ベンチマークが滑らかに伸びていたカーブが急に立つかもしれない」。事前に「もう間に合わない」と分かったときには遅い、というのが彼らの主張である。

政策提案：「協調的ブレーキ」の中身

論考の後半は安全側の提案で、ここが最も賛否を呼んでいる。

提案されていること

要点は次のとおりだ（The Register、PYMNTS）。

フロンティアAI開発を一定の条件下でスローダウン、または一時停止する「制度的選択肢」を世界で共有する
単独行動ではない。複数の有力ラボが、複数国にわたって、同じ条件で同意した場合にのみ意味を持つ
制度設計の参考は、米ソ冷戦期の核兵器管理条約。検証可能で、相互不信を前提に成り立つ枠組み
目的は「進化を止めること」ではなく、「アラインメント研究や社会の制度がAIの進化に追いつく時間を作ること」

ここまで読んで「現実味あるのか？」と思った方は多いはずだ。論考自身も「現状そのような仕組みは存在しない」「ハードルが高いことは認める」と書いている。

同時期のもう1つの動き：NSA関連の報道

ここから影に入る。同じ週の前半に、Decryptが「AnthropicがNSAに対してClaudeを介した対中国サイバー作戦を支援していると報じられた」と書いた（Decrypt、Financial Timesの先行報道を引用）。Anthropic、NSAの両者とも公式コメントを出していない未確認情報である点には注意が必要だが、報道のタイミングは皮肉に映った。「世界に対してAIを止めようと言いながら、自分は政府機関とAI運用で連携している」と読まれる余地が生まれた、という意味で、論考の動機への懐疑材料として批判側に引用されている。

ここを根拠に、批判側は次のように主張する。

反論：「これは規制をめぐる堀作りだ」

論考に対する代表的な批判を3つ紹介する。

David Sacks氏の見解：規制によるmoat（堀）作り

ベンチャーキャピタリストで現政権のAI顧問でもあるDavid Sacks氏は、AnthropicのCEOであるDario Amodei氏の発信を「regulatory capture（規制の自分用調達）」と批判してきた経緯がある（TechRadar）。論調は「危険だと叫び続けて規制を作り、自社が満たしやすい基準にすれば、後発のスタートアップは追いつけなくなる」というもの。今回の論考もその延長線上として扱われている。

Noah Giansiracusa氏：そもそも一時停止は実装不能

数学者・AI評論家のNoah Giansiracusa氏は、グローバルな一時停止は「literally impossible（文字どおり不可能）」だと指摘した（Scientific American）。検証手段がなく、参加しないラボや国家を罰する手段もない以上、提案は事実上「安全への配慮を表明する儀礼」に過ぎないという見方だ。

Gary Marcus氏：パニックする必要はないが、ガバナンスの議論は前進した

逆方向の論評もある。長年AIの過剰な期待に懐疑的なGary Marcus氏は「Anthropicの論考にパニックする必要はないが、AIガバナンスを真剣に話す土俵を提供したことは評価する」とSubstackに書いた（Gary Marcus Substack）。「80%」という数字を見出しにする論考の戦略には批判的だが、内容自体は「冷静に読むべきもの」とまとめている。

Hacker Newsの空気

Hacker Newsのスレッド（HN #48400842）は約300ポイントまで上がり、コメントは377件。論調はおおむね3分されている。

「年内のAI論考で最も重要」と評価する派
「ただのコーディングエージェント改善であって、RSIとは別次元の話」とする派
「IPO直前のポジショントーク」とする派

「同じ週にIPO S-1の提出と、社内生産性データの開示と、規制を求める論考が同時に出るのは、偶然にしては出来すぎている」というコメントが象徴的だった。

本記事の立場

本記事は両論を併記する立場を取る。Anthropicの内部データを鵜呑みにもしないし、批判側の『すべてポジショントーク』論にも乗らない。フリーランスや小規模チームのPMがどう動くべきか、最後のセクションで自分の判断を書く。

フリーランス・小規模チームへの実務的な含意

ここからは「で、自分はどうすればいいのか」の話だ。

1. 「人間が書いた」「AIが書いた」の境界はもう曖昧

Anthropicが社内で80%という数字に到達した以上、競合のAIラボや大手SaaS企業も同じカーブにいる可能性は高い。クライアントワークでも、自分のリポジトリで「人間とAIどちらが書いたか」を区別すること自体が現実的でなくなりつつある。納品物の責任は人間にあり、その人間がレビューに使える時間が新しいボトルネックになる。

ここで効くのが、コードレビュー側のAI化だ。Anthropicが論考で「人間のレビュー速度が今のボトルネック」と書いたことを真に受けるなら、自分のレビュー側も増強しなければ全体の速度は上がらない。具体的には、Claude Code security-guidanceプラグインのような自動レビュー層を組み込むことが現実解になる。

2. 「ベンダーロックインのリスク」が言い換えになっている

論考の裏返しとして、「Claudeが自社開発に深く食い込みすぎている」という解釈が成り立つ。Anthropic社内ですら、Claudeが書くコードに対するレビューが人間チームのキャパで止まっている状態だ。これは外部の業務利用にも同じ構図を持ち込む。

自社のリポジトリで特定のAIエージェントだけに依存しないように、AIコーディングエージェント比較2026で触れたような複数モデルの併用や、ベンダー切替コストを下げる設計を考えておくほうがよい。

3. IPOというフィルター

Anthropicは2026年6月初旬にSECへS-1を秘密提出している（公式発表）。今回の論考は、市場が同社の「AI安全研究機関としての顔」と「商業的成功」の両立を信じるかどうかを問う材料でもある。詳細はAnthropic IPOガイドとAnthropic IPO秘密提出ニュースに書いた。

PMの一般的な視点で読めば、市場が「Anthropic = 危険なほど強いAIを持つラボ」と認識する効果は中期的なブランド形成に寄与する可能性が指摘されている（TechRadar）。「ブレーキを叫ぶこと自体がアクセルになる構図ではないか」と読まれる余地が、論考と同時に存在しているわけだ。なお本記事は投資勧誘や上場後の業績見通しを語るものではない。

Claude本体の最新動向は「Claude Opus 4.8完全ガイド」「Claude Code 大型アップデート」、Claudeが社内開発を加速する具体的な仕組みは「Claude Code Dynamic Workflows解説」をどうぞ。

詳しく見る

電脳狐影の判断：自分ならこう読む

PMとしての判断を率直に書く。

論考は「AI安全のための真摯な提案」と「商業的なポジショントーク」が同居している、と読むのが正確だと思う。どちらかに振って解釈する必要はない。両方が事実として成り立つ。

そのうえで、自分が業務で気にするのは次の3点だ。

1つ目は、「80%」の数字を社内データとしてどう扱うかだ。Anthropicが出した数字は「Anthropicという組織」での話であり、フリーランスのクライアントワークや一般的なSIerでそのまま再現可能とは限らない。Anthropicは「世界で一番Claudeを使い倒している組織」であり、その伸びを自分の数字と比べるのは過剰な期待になりやすい。自社で測れる指標（PRあたりのレビュー時間、エラー混入率、手戻り件数）を別に取り、AIの効果は社内データで判断するのが安全だ。

2つ目は、論考が暗黙に提示している「レビュー速度が新しいボトルネック」という観察を、自分のワークフローに当てはめることだ。AIにコードを書かせるほど、人間が見るべき差分は増える。差分が増えれば質の劣化はほぼ確実に起きる。レビュー側の自動化（Claude Code security-guidanceなど）を、コード生成側と同じ速度で増強しないと、半年後に「速くは書けたが品質が落ちた」で詰まる。

3つ目は、政策提案の現実性は低く見積もるべき、ということだ。一時停止に関しては、Anthropicが今後どんなに発信しても、複数のラボ・複数国の利害がそろうことは現実的に難しい。発信そのものは続くだろうが、規制が業務に直接効いてくるのはもう少し先になる。だから「制度ができてから準備する」ではなく、「アラインメント・セキュリティ・倫理の体制を今から自分のリポジトリと契約書に組み込む」ほうが筋がよい。

業務の優先順位はそのままだ。レビュー側のAI化、ベンダー依存の低減、自社指標の確立。論考はその背中を押す材料にはなるが、新しいタスクは生まない。

まとめ：今日読んでおくべき1本

論考そのものはAnthropic公式ページで全文が読める。読むなら次の順を勧める。

公式ページの本文（30分程度）
Hacker Newsのコメント上位10件
TechRadarの批判記事（批判側の代表）
Scientific Americanの解説記事（中立解説）

賛同・批判のどちらに着地するにせよ、「Anthropicが2026年6月に何を出したか」は、これから半年のAI業界の議論の土台になる。読んでおく価値はある。

AnthropicやClaude周りの構造を体系的に押さえたい方は「Anthropic完全ガイド」「Anthropic vs OpenAI ビジネスモデル比較」、Claudeの研究所側の動きは「Anthropic Institute AI Risk Research」もあわせてどうぞ。

詳しく見る

免責事項: 本記事の情報は2026年6月6日時点のものだ。Anthropicが公表する数値（社内コード比率、生産性指標、Mythos Previewの性能）は内部データに基づくものであり、第三者による独立検証は行われていない。論考が提案する政策枠組みは検討段階で、現時点で発効した規制ではない。AnthropicのIPO関連の情報はS-1秘密提出段階のものであり、上場時期・条件は変更される可能性がある。引用したコメント・批評は各論者の個人的見解だ。本記事は一般情報として提供するもので、投資判断や法務助言を構成するものではない。