---
video_id: tSOjux2CMM0
title: "危険すぎてAnthropicが封印「Claude Mythos」爆誕"
channel: "TBS CROSS DIG with Bloomberg"
published_at: "2026-04-09"
youtube_url: "https://www.youtube.com/watch?v=tSOjux2CMM0"
flecto_url: "https://flecto.zer0ai.dev/ja/youtube/tSOjux2CMM0/"
language: "ja"
---

# 危険すぎてAnthropicが封印「Claude Mythos」爆誕

## Key Takeaways

### 1. Claude Mythosのベンチマーク性能が示す新時代
Claude Mythos Previewは従来4-5%ずつの改善が常識だったベンチマークで10-20%以上の飛躍を実現。SWE-bench Verified 93.9%、GPQA Diamond 94.5%、HLE 64.7%（ツール使用時）を達成し、コーディング能力と総合的知性の「両立不可能」とされた壁を突破した。今井翔太は「SWE-benchとHLEのスコアの組み合わせを見てエイプリルフールを疑った」と語る。

### 2. サイバーセキュリティにおける一線を超えた能力
Mythosは主要OS・ブラウザで数千件のゼロデイ脆弱性を自律的に発見。最も堅牢とされるOpenBSDで27年間放置されていた脆弱性も検出した。Cybench pass@1で満点1.00、CyberGym 0.83で大幅リード。「人間にはコスパが悪すぎて不可能だったことをAIが無制限に実行できるようになった転換点」と今井は指摘する。

### 3. Anthropicの爆発的成長と「Claudenomics」
Anthropicの年間売上ランレートは2025年末の90億ドルから2026年4月に300億ドルへ3倍以上に急成長、OpenAIを初めて逆転。Metaが社内で「Claudenomics」と名付けたランキングで85,000人の社員が月間60兆トークンを消費（推定9億ドル/月）。「トークンマキシング」がエンジニアの生産性指標になる時代の到来。

### 4. Meta Muse Sparkの登場とオープンソース路線の転換
Meta Superintelligence Labs（MSL）初のモデル「Muse Spark」は、Llama 4に匹敵する性能を桁違いに少ない計算量で実現。しかし従来のオープンソース路線を転換しプロプライエタリモデルとしてリリース。Alexandr Wang（元Scale AI CEO、19歳で起業）が統率し、約9ヶ月で開発。マルチモーダル分野では健闘するも、コーディング分野ではフロンティアモデルとの差が残る。

### 5. AI安全性と公開判断の歴史的意味
Dario Amodeiは2019年のGPT-2（OpenAI時代）でも危険性を理由に公開を制限した人物。今回のMythos非公開は「同じ人間が再び公開を止めた」歴史的パターンの繰り返し。ただしMythosの能力レベルは「GPT-2とは比較にならない」真の脅威。システムカードでは「最も安全だが最も危険なモデル」と矛盾的に表現 — 優秀な登山家の比喩で説明される。

## Content Flow

### 00:00 - 04:29 | 新型Claude「エイプリルフールかと思った」
今井翔太がClaude Mythosの発表を見てまずアメリカのエイプリルフールの日付を確認したエピソードから番組が始まる。GPT-2（2019年）でもOpenAIが危険性を理由に公開を制限したが、その論文の著者にDario Amodei（現Anthropic CEO）の名前がある。「やつがまたやったのか」という今井の印象が、Mythos非公開の歴史的パターンを浮き彫りにする。

### 04:29 - 09:30 | ベンチマークで見るMythosの威力
SWE-bench Verified 93.9%、SWE-bench Pro 77.8%、GPQA Diamond 94.5%。従来4-5%の改善が常識だった世界で10-20%以上の飛躍。「GPT-4以降で初めてのレベル」と今井は評価。散々待たされたGPT-5を横目にAnthropicからポッと出てきた衝撃は大きい。

### 09:30 - 13:00 | コーディングと総合知性の「不可能な両立」
HLE 64.7%（ツール使用時）で大幅ジャンプ。HLE 50%超えが1年前のGrok以来で、そこから10%以上跳ねた。SWE-benchとHLEの両立がエイプリルフールを疑った最大の理由。GPT-5.4はHLEスコアを「ひっそり公開」— あまり上がらなかったことと対照的。

### 13:00 - 17:00 | ほぼ全ての人間を凌駕するサイバースキル
Cybench pass@1で満点1.00 — もはやベンチマークとして参考にならないレベル。CyberGym 0.83で大幅リード。最も堅牢なOSと言われたOpenBSDで27年前の脆弱性を発見。OS専門のトップ大学教授も「うまじかよ」と驚愕。「実際のソフトウェアを使った評価の方がいい」とシステムカード自身が言及するほどの性能。

### 17:00 - 23:25 | 一般公開見送りとProject Glasswing
AWS、Apple、Google、Microsoft、NVIDIA等50社以上にMythos Previewを限定提供。1億ドルの利用クレジット付き。API価格は入力25ドル/M、出力125ドル/M（Opus 4.6の5倍）— パラメータ数5T超えの可能性を示唆。「最も安全だが最も危険なモデル」という矛盾は「優秀な登山家」の比喩で説明される。

### 23:25 - 27:00 | Anthropicの成長速度は予測を大幅に上回る
2025年末90億ドル → わずか3ヶ月強で300億ドルへ。The Informationの内部文書に基づく予測をすでに上回った。Claude CodeとQuit GPTムーブメントが急成長の要因。「2日に1回か1日に1回なんかリリースしてる」— 自社でもClaude Codeを駆使した圧倒的生産性。

### 27:00 - 31:00 | トークンマキシング — AIトークンが新たな通貨に
Meta社内「Claudenomics」ランキング: 85,000人が競い合い、月間60兆トークン = 約9億ドル（1,400億円）。MythosのAPI価格がOpus 4.6の5倍なら月45億ドルの可能性も。Jensen Huang: 「年収50万ドルのエンジニアが25万ドルのAIトークンを使っていないなら、それは警鐘」。プログラマーの実力 = 資産力の時代へ。

### 31:00 - 38:18 | TPU大量調達・Amazon連携・「Claude Codeがバカになった」
3GW分のGoogle TPUを利用する契約。GPU + TPU + Amazon Trainiumの全方位調達。利用過多で「Claude Codeがバカになった」問題、OpenClawでもClaude利用不可の報道。マルチモーダル性能はGeminiと競り合い。IPOも検討中（Goldman Sachs・JPMorganと協議）。「Anthropicギロチン」— スタートアップだけでなく大企業の首も飛ぶレベル。

### 38:18 - 42:00 | Meta Superintelligence Labs初のモデル「Muse Spark」
Alexandr Wang（元Scale AI CEO、19歳で起業）が統率するMSL初のモデル。コードネーム「Avocado」、約9ヶ月で開発。TBD Lab、FAIR、Products and Applied Research、MSL Infraの4部門構成。Llama 4に匹敵する性能を桁違いに少ない計算量で実現するが、従来のオープンソース路線を転換しプロプライエタリモデルとしてリリース。

### 42:00 - 47:22 | Muse Sparkはフロンティアに追いつけたか
CharXiv Reasoning、MMMU Proなどマルチモーダルでは健闘。しかしSWE-Bench Verified等のコーディング分野ではまだフロンティアモデルとの差がある。「実用レベルだとそんなに高く評価されていない」という冷静な分析。それでも「Metaがフロンティアモデルレースに追いついた」こと自体は大きな進歩。