AI知識まとめノート
Claude Mythosとは?強すぎて一般公開なし——Anthropicが開発した「危険すぎるAI」をわかりやすく解説

Claude Mythosとは?強すぎて一般公開なし——Anthropicが開発した「危険すぎるAI」をわかりやすく解説

「強すぎるAIを作ってしまった——だから一般公開しない」

そんな前代未聞の判断を下したのが、2026年4月7日にAnthropicが発表したClaude Mythosだ。コードネームは「Capybara」。一般ユーザーが使えるモデルではなく、限られた企業だけがアクセスできる特別なAIとして発表された。

Claude Mythosって何者?

一言でいうと、サイバーセキュリティに特化した超高性能AIモデルだ。

通常のClaudeと同じAnthropicが開発したが、「危険性が高すぎる」として一般公開はされていない。代わりに「Project Glasswing(プロジェクト・グラスウィング)」という枠組みの中で、防御的セキュリティ目的に限って特定12社だけに提供されている。

何がそんなにヤバいのか

簡単に言うと、ソフトウェアの脆弱性を自分で見つけて、攻撃するコードまで自動で書ける

具体的な数字を見ると驚く:

比較Claude Opus 4.6Claude Mythos
SWE-bench(コーディング)80.8%93.9%
Firefoxのエクスプロイト2件181件
エキスパートタスク成功率ほぼ0%73%

Firefoxの脆弱性を攻撃するコードを書かせたら、従来モデルが2件しか成功しなかったのにMythosは181件成功。これが公開できない理由だ。

さらに:

  • OpenBSDに27年間存在していた脆弱性を発見
  • FFmpegのH.264コーデックに16年間存在していた脆弱性を発見
  • セキュリティの専門知識がないAnthropicのエンジニアが、Mythosを使って一晩でリモートコード実行の脆弱性を発見できた

誰が使えるの?

「Project Glasswing」に参加している12の組織のみ:

AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、Anthropic

これらの企業は「防御目的」でのみ使える。つまり、脆弱性を見つけて修正するための使用に限定されている。

Anthropicは参加企業に**$1億分のモデル利用クレジットを提供し、オープンソースセキュリティ団体への$400万の寄付**も行っている。

将来的にはどうなる?

Anthropicは「Mythosの能力を、適切な安全対策とともに次期Claude製品に組み込む」方針を示している。

つまり今は「危険すぎて出せない」状態だが、安全性を担保しながら段階的に一般モデルに取り込んでいく予定というわけだ。

情報

「性能が高すぎて公開しない」という判断は、2019年のGPT-2でも前例があった。当時OpenAIはフェイクニュース生成への懸念からフルモデルの公開を数ヶ月見送ったが、最終的には完全公開した。Mythosが異なるのは「段階的公開」ではなく「特定12社への永続的な限定提供」という点だ。この規模・形式での非公開はAI史上でも珍しいケースといえる。

まとめ

ポイント内容
発表日2026年4月7日
一般公開なし(Project Glasswing参加12社のみ)
強みゼロデイ脆弱性の自律発見・エクスプロイト生成
位置づけClaude Opus 4.6の上位モデル
今後次期Claudeに安全対策とともに統合予定

普通のAIツールとして使えるわけじゃないが、「AIがセキュリティ分野でここまで来た」という意味で、AI全体の進化を象徴する出来事といえる。

参考リンク

関連記事