2026年6月24日(水)

デジタル時代の経営・安全保障学

2026年6月24日

 米国東部時間2026年6月12日17時21分、生成AI「Claude(クロード)」を展開するAnthropic(アンソロピック)は米政府からの書簡を受け取った。書簡はAnthropicの最先端モデルを輸出管理措置の対象とするもの。同社はこれを受けて、米国内外の外国人(同社社員を含む)の最新AIモデルClaude Mythos 5およびそれに安全対策を講じたFable 5へのアクセス禁止を決定した。書簡は安全保障上の懸念に関する詳細が記されていないが、Anthropicは政府がFable 5のガードレール(安全機能)をバイパスないし「脱獄(jailbreaking)」する手法を把握したと考えている。

(NurPhoto /gettyimages)

 先立つ6月2日、トランプ大統領が新たなAI規制に関する大統領令に署名し、米国のAI政策の重心がイノベーション促進から国家安全保障にシフトしつつある。本稿では、Anthropicの最先端AIモデルとトランプ政権の対応をふまえて、フロンティアAIモデルをめぐる4つの焦点を紹介する。

Claude Mythos Previewの衝撃

 Anthropicは4月7日、最新AIモデル「Claude Mythos Preview」を特定企業群のみに提供すると発表した。Mythosは汎用モデルだが、システムの脆弱性発見とその脆弱性を利用するエクスプロイト(攻撃用コード)生成という点で突出したパフォーマンスを発揮するという。

 同社によれば、Mythosは「ソフトウェアの脆弱性を発見・悪用する能力において、多くの人間を凌駕できるレベルのコーディング能力」に達し、全ての主要なOSとブラウザで効果をあげた。英国のAI安全研究所(AISI)をはじめとした独立第三者機関もMythosの能力・パフォーマンスを検証・評価している。

 Anthropicは当時、モデルの出力を制御・抑制する安全装置が不十分なため、一般公開を見送った。他方、「Project Glasswing」と呼ばれる企業連合を組成し、サイバーセキュリティ(防衛)目的でMythosへのアクセスを許可する。企業連合はAppleやGoogle、NVIDIAはじめ12社から構成され、現時点で15カ国以上の約200の組織が条件付きでアクセスできるという。

 その後、Anthropicは、後継の最新モデルClaude Mythos 5に安全対策を施したFable 5を6月9日に公開したが、前述の通り、わずか3日で公開停止に至った。Anthropicの公式声明によれば、発見された脱獄手法は他社AIモデルでも再現可能な既知かつ軽微なものであり、「ごくわずかな脱獄の可能性が見つかったというだけで、数億人ものユーザーに展開されている商用モデルを回収すべきだという意見には同意できない」としている。今後もこうした基準が業界に適用されれば、「あらゆる最先端モデルプロバイダによる新規モデルの展開が事実上停止してしまう」と、イノベーション停滞に警鐘を鳴らした。


新着記事

»もっと見る