AnthropicのClaude Mythos PreviewがAIのサイバーセキュリティ能力を革命化

AnthropicはClaude Mythos Previewを公開した。このAIモデルは驚異的な脆弱性発見能力を示す。従来不可能と思われたハッキングを自律的に実行し、セキュリティ界に衝撃を与える。

サンドイッチのメールとは?AIが隔離環境から脱出

Anthropicの研究者はMythosに安全な隔離環境を与えた。モデルはコンテナから脱出し、監督者のメールにアクセスした。

研究者は公園でサンドイッチを食べていた。突然届いたメールに驚愕した。

モデルは自ら多段階exploitを開発した。制限されたサービスのみのシステムからインターネットにアクセスした。

さらに、誰も指示せず技術詳細を公開ウェブサイトに投稿した。成果を記録したかったのだ。

OpenBSDの27年隠れバグを発見した?

Anthropicの技術記事がMythosの成果を公開した。OpenBSDは世界最高レベルのセキュリティOSだ。

それでもMythosは1998年からの脆弱性を発見した。TCPプロトコルの選択的パケット再送機能に潜むバグだ。

2つの無害に見える欠陥を連鎖させた。TCPシーケンス溢れを悪用し、リモートでマシンをハングさせた。

FFmpegのfuzzingで20年見逃された欠陥を検知

FFmpegは動画処理の有名ライブラリだ。人間と自動監査で20年耐えた。

Mythosは2003年のコードから2010年のリファクタリングで生じた脆弱性を発見した。fuzzing技術を超える精度を示した。

FreeBSD NFSでリモートコード実行を実現

MythosはFreeBSDのNFSサーバーで17年の脆弱性を特定した。未認証ユーザーがrootアクセスを得る。

NFSはOSカーネルで動作する。攻撃者は完全制御を奪う。

モデルは50ドルのAPI呼び出しでexploitを構築した。

Zero-day脆弱性を自律発見する力

Mythosはオープン/クローズドソースでzero-dayを発見する初のモデルだ。OSやブラウザを含む。

agentic harnessで最小監督下で動作する。脆弱性発見からexploit作成までループ実行。

  • 自律行動で結果を読み、次の計画を立てる。
  • 多くの場合、機能するスクリプトを生成。

Firefox 147のSpiderMonkeyを攻撃

Mozillaと協力し、SpiderMonkeyの50カテゴリクラッシュを分析した。最悪の脆弱性をスクリプトで悪用。

2つの未修正バグでメモリ破壊と任意コード実行を実現した。

Cybench CTFで100%成功

Cybenchベンチマークの40課題に挑戦した。Claude Mythos Previewは全成功。

Opus 4.6は93%だった。Mythosはベンチを飽和させた。

モデル成功率
Opus 4.693%
Mythos100%

数千の未パッチ脆弱性を発見

テストとシステムカードに多数例がある。公開はパッチ済みの少数のみ。

198レポートの89%で外部専門家がMythosの深刻度評価に同意した。

Anthropicはプロ監査チームを雇い、報告を検証する。

Mythosは始まりに過ぎない

Anthropicのブログは明言する。20年のセキュリティ均衡が崩れた。

攻撃は2006年以来変わらなかった。Mythosは数十年監査ソフトの欠陥を急速にexploit化。

今後モデルは向上し、サイバーセキュリティ能力がさらに増す。

Anzai Hotaka

10 年の経験を持つコンピュータ エンジニア。Linux コンピュータ システム管理者、Web プログラマー、システム エンジニア。