メインコンテンツへスキップ
AI News 16分で読める

Claude Mythosとは|Anthropic新モデルがデータ漏洩で発覚

この記事はこんな人におすすめ
  • Claude・Anthropicの最新動向をキャッチアップしたいエンジニア・PM
  • AIのサイバーセキュリティリスクに関心があるセキュリティ担当者
  • 次世代AIモデルの能力と展開計画を把握しておきたい方

「AIの安全性を最優先する企業が、自社の最も危険なモデルを誤って世界に公開してしまった」。X(旧Twitter)上でのCN Wire(@Sino_Market)の指摘は、今回の一件を端的に言い表している。

2026年3月26日、Fortuneの独占報道により、Anthropicが社内で開発・テスト中の新AIモデル「Claude Mythos」の存在が明るみに出た。正式発表ではなく、設定ミスによるデータ漏洩が発覚のきっかけだった。

データ漏洩の経緯:設定ミスで公開されたドラフト

経緯はシンプルだ。Anthropicの外部CMSツールに設定エラーが発生し、未発表モデルの発表用ドラフトブログ記事が、誰でも検索・閲覧できるデータストアに保存されていた。

サイバーセキュリティ研究者がこれを発見し、Fortuneに通報。Fortuneの記者が文書を確認し、3月26日に独占スクープとして報じた(Fortune、2026/3/26)。

同じデータベースには、欧州で予定されているCEO招待制サミット(大企業向けのクローズドイベント)の詳細も含まれていた。発覚後、Anthropicはすぐにアクセスを制限し、「外部CMSツールの問題により、ドラフトコンテンツがアクセス可能な状態になっていた」と公式に認めた。

安全性を重視するAI企業であっても、インフラの設定ミスは起きる。この状況は、テック界隈でも皮肉な指摘の対象となった。

Claude Mythosとは何か:Opus超えの新モデル階層

ドラフト文書から明らかになった内容をまとめる。

Anthropicはこのモデルを「これまでに開発した中でずば抜けて最も強力なAIモデル」(by far the most powerful AI model we’ve ever developed)と表現している。「ステップチェンジ(段階的な変化ではなく、次元の違うジャンプ)」という言葉も使っている。

能力の柱は3つだ。

  • 推論(Reasoning):学術レベルの複雑な推論でClaude Opus 4.6を大幅に上回る
  • コーディング(Coding):ソフトウェア開発の各ベンチマークで劇的に高いスコア
  • サイバーセキュリティ(Cybersecurity):「現在、サイバー能力で他のあらゆるAIモデルを大幅に凌駕している」

ドラフト文書には「Capybara」というコードネームも登場する。これはモデルの内部名称であると同時に、新しいモデル階層の名称でもある。

「Capybara」:Opusを超える第4の階層

AnthropicのモデルラインナップはHaiku(軽量)→ Sonnet(中型)→ Opus(最高性能)という3層構造だった。Claude Mythosは「Opus以上に大きく、より知性が高い」新しい階層として設計されている。

モデル階層位置づけ
Haiku軽量・高速・低コスト
Sonnetバランス型(現在の主力)
Opus最高性能・複雑タスク向け
Capybara(Mythos)Opus超え・新フラッグシップ

ドラフトには「Capybara gets dramatically higher scores on tests of software coding, academic reasoning, and cybersecurity compared to Claude Opus 4.6」とある。「劇的に高いスコア」という表現は、マーケティング的誇張の可能性もゼロではないが、同社が自社の内部文書で用いた表現だ。外部向けに見栄えよく書いたドラフトであれ、対Opus 4.6での性能向上は相当程度のものと見るのが妥当だろう。

(Opus 4.6の現状については「Claude Sonnet 4.6レビュー」も参照)

なぜAnthropicは自社モデルを「前例なきリスク」と表現したか

ここが今回最も重要な点だ。

Anthropicは自社の新モデルについて、自ら「前例のないサイバーセキュリティリスクをもたらす」と書いていた。AI企業が自社製品のリスクをこれほど明確に認める文書が公開されることは、異例中の異例だ。

この発言の背景には、直近のClaudeに関するセキュリティインシデントが積み重なっていることがある。

Claude Opus 4.6が22件のFirefox脆弱性を発見(2026年3月)

Anthropicは2026年3月初旬、Mozilla Firefoxのセキュリティ検証プロジェクトでClaude Opus 4.6を使い、2週間で22件の脆弱性を発見したと発表した(TechCrunch、2026/3/6)。

内訳は高深刻度14件、中程度7件、低深刻度1件。これは2025年にFirefoxでパッチが当たった高深刻度バグの「約5分の1」に相当するとAnthropicは述べている(推定値)。探索開始から20分でuse-after-free(解放済みメモリへのアクセスによるメモリ破壊バグ)を検出し、Anthropicは112件の報告をMozillaに提出した。

Anthropicによれば実験のコストはAPIクレジット約4,000ドル(同社報告より)。2週間でそれだけの脆弱性を見つけられるなら、悪意ある利用者にとっての「コスパ」が一変することを意味する。

中国系APTグループがClaude Codeで30組織に侵入

2026年2月にAnthropicが公開した報告書によれば、中国政府と関連する国家支援型ハッカーグループ(APT:高度で持続的な国家支援型攻撃者の総称)が、Claude Codeを使って約30の組織(テック企業・金融機関・政府機関)への侵入を試みたことが判明している(Anthropic公式、2026/2月)。

このキャンペーンでは、Claude Codeが偵察・脆弱性探索・エクスプロイト・ラテラルムーブメント(侵入後の内部ネットワーク横展開)・認証情報収集・データ流出など、攻撃サイクルの80〜90%を自律的に実行したとされる。

(この一連のセキュリティ動向については「Anthropicの蒸留攻撃対策レポート」も参考になる)

メキシコ政府データ窃取事件(2026年2月)

同月、ハッカーがClaudeを使いメキシコ政府の機密データを窃取したことがBloombergにより報じられた。Anthropicはこれらの悪用事例に対してアクセス制限等の対策を取っているが、「悪用の前提となる能力がモデルに備わっている」という事実は変わらない。

Claude Mythosはこれらの「前モデル」より劇的に強力だという。Anthropicが慎重になるのは、当然だ。

Info

Claude MythosとClaude Code Securityの関係

Anthropicは2026年2月に「Claude Code Security」を発表し、AIによる脆弱性スキャンを公式ツールとして提供している。Claude Mythosが持つサイバー能力は、このセキュリティ製品をさらに強力にする可能性がある。守護と攻撃の両面を持つ刃だ。(「Claude Code セキュリティ告知」)

光と影:Mythosの何が「前例なき」のか

AI能力の向上はいつも「光と影」の両面を持つが、Mythosについて特異なのは、Anthropic自身が社内文書で影の部分を明言していた点だ。

光(期待できること)

  • ソフトウェア開発の自動化がさらに進む
  • セキュリティ研究・バグバウンティへのAI活用が加速する
  • 複雑な推論タスクにおける作業効率が跳ね上がる
  • エンタープライズ向けAIエージェントの信頼性が上がる

影(懸念されること)

  • 悪意ある利用者が低コストで高精度の脆弱性探索ツールを得る
  • 国家支援型APTグループによる悪用がより容易かつ高度になる
  • 「判断の正確さ」が増すほど、誤った判断も高精度に実行されるリスクがある
  • リリース前にセーフガードが間に合わない可能性

「Anthropicは自社モデルが持つサイバー能力をFirefoxプロジェクトで公示した上で、さらに強力なモデルを出す。市場競争の影響下での安全性評価スケジュールは、外部から検証できないのが現実だ」という懸念も業界内では聞かれる。

(Anthropicのセーフガード哲学については「Anthropic完全ガイド2026」に詳しい)

アーリーアクセスの実態:招待制CEO サミットとの関係

もう一つ漏洩した情報が興味深い。欧州で開催予定のCEO招待制サミットの詳細が同じデータベースに含まれていた。

これはAnthropicが大企業顧客向けに行っている戦略的売り込みの一環と見られる。Claude Mythosのアーリーアクセスは、そうした大企業エンタープライズ顧客から始まっているのだろう。一般のClaudeユーザーや中小企業がアクセスできる時期は、現時点では不明だ。

Claude Codeのエンタープライズ展開については「Claude Code Auto Mode完全ガイド」も参照してほしい。

電脳狐影の判断

PMとして、この件を整理する。

最も重要なのは「Anthropicが自社モデルを前例なきリスクと認めた」という事実だ。これは誠実さの表れでもある一方、リリースの遅延や規制当局との摩擦を示唆する可能性もある。

漏洩そのものについては、皮肉な出来事だと感じた。安全性を旗印にする企業が、設定ミスで自社の未発表モデル情報を公開データベースに置く。組織規模が大きくなるほど、内部統制の穴は見えにくくなる。Anthropicもその例外ではなかった。

モデルの能力については慎重に見たい。「劇的に高いスコア」という表現は、Anthropicが自社の宣伝用に書いたドラフト文書の言葉だ。実際の性能は、正式リリース後のベンチマーク検証を待つ必要がある。GPT-5.4との比較については「GPT-5.4 vs Claude Opus 4.6」の続報として注目している。

一般公開のタイミングは、おそらく早くて2026年Q2〜Q3。Anthropicのエンタープライズ顧客向けから始まり、段階的にAPIとClaudeプランへ展開されると予測する。ただしサイバーセキュリティ能力については、Anthropicが独自のアクセス制限を設ける可能性が高い。

(Anthropicの軍事・安全保障方針については「Anthropic-Pentagon問題」も参照。Mythosの展開と連動する可能性がある)

Claude Mythosの続報をキャッチアップするには

現時点ではMythosは一般公開されていない。最新情報はAnthropicの公式ブログとFortuneのテックカバレッジで追うのが確実だ。

正式リリース後にAPIを使いたい場合は「Anthropic API ドキュメント」を参照。

詳しく見る

本記事の情報は2026年3月27日時点のものです。Claude Mythosは未公開モデルであり、正式仕様・リリース日は発表されていません。本記事はFortuneの独占報道およびAnthropicの公式声明に基づいており、性能・機能に関する記述はドラフト文書からの情報を含みます。

Share