消えた​「最強AI」が、​戻ってきた​ ──Fable 5再展開で​わかった、​AIモデルの​新しい​"戻り方​"

6月に米政府の指令で全停止したClaude Fable 5が、7月1日に再展開された。でも「元通り」ではない。安全分類器で止めたリクエストを拒否せずOpus 4.8へ回す"能力の降格"、政府(CAISI)によるテスト、業界共通のjailbreak評価基準。戻り方そのものが、AIモデルは「リリースして終わり」から「運用し続けるもの」に変わったことを示している。何が止まり、どう戻り、何が変わったのかを、AIを業務に使う側の目線で分かりやすく整理する。

甲斐ショウジ甲斐ショウジ
CAG主宰/合同会社ATK CAIO(最高AI責任者)
技術14分で読めます
技術消えた「最強AI」が、戻ってきた ──Fable 5再展開でわかった、AIモデルの新しい"戻り方"

気になるAIニュースを、分かりやすく | 最新動向を、現場目線で

Claude Fable 5が戻ってきた。[1]

このニュース、見出しだけなら「強いモデルがまた使えるようになった」で終わる。実際、戻ってきたこと自体はうれしい話だ。でも今回いちばん面白いのは「戻ったこと」ではなく、どう戻ったかだった。ただ電源を入れ直したわけではない。安全装置を足し、止めたリクエストは拒否せず別のモデルに回し、政府にテストしてもらい、他社と一緒に評価の基準を作ろうと言い出した。

つまり、AIモデルはもう「発表して、はい終わり」の製品ではなくなりつつある。止まる、戻る、条件が変わる。そこまで含めて"仕様"になり始めている。この記事では、Fable 5に何が起きて、どう戻って、何が変わったのかを、専門用語を避けて分かりやすく整理する。私たち電脳技巧集団(AI職人ギルド)も毎日Claudeでものを作っている側なので、スペックの話としてではなく「で、AIを仕事に使う側は何を見ておけばいいのか」という目線で読み解いていく。[2]

ダークな運用管制室のような画面。中央に Claude Fable 5 と表示された大きなステータスが SUSPENDED から REDEPLOYED へ切り替わり、周囲に安全分類器・fallback・監視の小さなパネルが並ぶ
止まっていたモデルが、条件を足されて戻ってくる——今のfrontier modelは"運用"されている

01何が​起きたのか——3日で​消え、​19日ぶりに​戻った

まず時系列を押さえる。ここが分かれば、あとは全部つながる。[3]

  • 6月9日:AnthropicがClaude Fable 5とClaude Mythos 5を発表。Fableは一般向け、Mythosは限られた相手向け(後述)。
  • 6月12日:米政府の輸出管理指令を受け、AnthropicがFable 5 / Mythos 5を全顧客向けに停止
  • 6月30日:その輸出管理が解除された、とAnthropicが説明。
  • 7月1日:Fable 5をグローバルに再展開。Claude Platform、Claude.ai、Claude Code、Claude Coworkなどで再び使えるようになった。
6月9日発表Fable 5 / Mythos 5 6月12日全停止輸出管理指令 6月30日解除規制が外れる 7月1日再展開条件つきで復帰
発表→全停止→解除→再展開。わずか3週間で「消えて戻った」が、戻り方が以前と違った(Anthropic公式・報道より)

面白いのは停止の理由だ。政府の指令は「foreign national(外国籍者)へのアクセスを止めろ」というものだった。ところが、リクエストを送ってきた人の国籍をリアルタイムで判定するのは現実的でない。だからAnthropicは、対象を絞れず全顧客を止めるという判断をした。「一部を止めろ」が「全部止まる」になる。これは、いまのAIサービスの止まり方の一つの典型だ。CAGでも6月に、この停止の瞬間を現場目線で追った続報を出している。

Fable 5 / Mythos 5 提供停止の記事のサムネイル 関連記事 | 3日後に消えた続報「最強」と紹介したAIは、3日後に消えた ──Fable 5 / Mythos 5 提供停止を、開発の現場から読む

02でも、​「元通り」ではなかった

19日ぶりに戻ったFable 5は、停止前と同じものではない。Anthropicは再展開にあたって、少なくとも3つの新しい仕掛けを一緒に発表した。[1]

  • 改善された安全分類器:停止のきっかけになったとされる特定の回避手法を狙って止める仕組み。Anthropicはこの手法を99%以上ブロックすると説明している。
  • Opus 4.8へのfallback:分類器で止めたリクエストを、ただ拒否するのではなく、能力を一段落とした別モデル(Opus 4.8)へ回す設計。
  • 政府・業界を巻き込んだ運用:政府機関(CAISI)が旧・新の安全策をテストしたこと、そして他社と一緒に「jailbreak(安全策の回避)の深刻度をどう測るか」という共通基準を作る構想。

「解除されたから元に戻した」ではない。「戻すために、何を足したか」がニュースの本体だ。ここから、いまのAIモデルがどう"運用"されているかが見えてくる。次の2章で、この足された仕掛けを順に見ていく。

03新しい​仕組み①:拒否ではなく​「能力を​落と​して​続ける」

いちばん設計として面白いのが、2番目のfallbackだ。

普通、AIに危ないことを頼むと「お答えできません」と拒否される。yes か no か、の二択だ。ところが今回のFable 5は、安全分類器が「これは止めたい」と判断したリクエストを、拒否する代わりにOpus 4.8へ回す。Opus 4.8はFable 5より前の世代で、その分だけ能力が抑えられている。[4]

これはつまり、「危険そうな依頼は、より安全なモデルに格下げして処理する」という発想だ。全部止める(no)でも、全部通す(yes)でもなく、その間に「能力を一段落とす」という選択肢を挟んだ。専門的にはこれを capability tiering(能力の段階化) と呼ぶ。

リクエストユーザーの依頼 安全分類器危ない依頼か判定99%以上ブロックと公式 通す → Fable 5フルの能力で回答 止めたい → Opus 4.8拒否せず"格下げ"して処理capability tiering 「返ってきた/拒否された」の二択でなく、"格下げされて返ってきた"というグレーが標準になる
危険そうな依頼は拒否ではなく、能力を落としたモデルへ回す——yes/noの間に「格下げ」を挟んだのが今回の設計

利用者から見れば、これは諸刃だ。危ない依頼をきっちり止めつつサービスは動き続けるので、全停止よりはるかにマシ。一方で、Anthropic自身が「日常的なコーディングやデバッグのような無害な依頼まで巻き込む(false positive=誤検知が増える)」ことを認めている。つまり、普通に使っていても「なぜか能力が落ちた応答が返る」瞬間がありうる。

AIを使う側として押さえておきたいのは、AIの応答を「返ってきた/拒否された」の二択で見てはいけなくなったということだ。「返ってきたが、実は格下げされたモデルの答えだった」というグレーが標準になる。品質が微妙に落ちる瞬間を、仕様として織り込んでおくほうがいい。

ダークテーマの運用ダッシュボード。リクエストの一覧が並び、多くは Fable 5 で処理され、一部の行が Opus 4.8 fallback とマークされて能力を落として処理された様子。上部に安全分類器のブロック率メーターが表示されている
大半はFable 5で処理され、分類器が引っかけた一部だけOpus 4.8へ回る——運用ダッシュボードで見た"格下げ"のイメージ

04新しい​仕組み②:政府・評価・業界基準が​"運用"に​入った

もう一つの変化は、モデルの周りに「誰が関わるか」が増えたことだ。

今回、Anthropicは政府機関 CAISI(NISTのCenter for AI Standards and Innovation)が旧・新の安全策をテストしたと説明している。CAISIは、商用AIをテストし、標準を作り、国防・サイバー・生物・化学といった観点でリスクを評価する政府側の窓口だ。「モデルを出す前に政府が中身を見る」という関わり方が、今回はっきり表に出た。[5]

さらにAnthropicは、Amazon、Microsoft、Googleといった相手と一緒に、jailbreakの深刻度をどう測るかという業界共通の基準を作る構想も出した。競合やパートナーが、単なる利用者ではなく「安全評価を一緒にやるプレイヤー」になっていく流れだ。

そしてMythos 5だ。誤解されがちだが、Mythos 5は一般開放されていない。Fable 5と同じ基盤の上に立ちつつ、一部の安全策を外した強力版で、Project Glasswing(重要インフラの脆弱性発見・修正などに使う限定プログラム)のような信頼できる相手にだけ渡される。FableとMythosの違いは「頭の良さ」ではなく、「どの安全策を、どこまで外せる相手か」という提供条件にある。[6]

モデル本体 性能・価格・API 安全分類器 継続監視fallback 政府評価(CAISI)業界の共通基準 "モデルの仕様"は、もう中心の性能・価格・APIだけではない
中心の性能・価格・APIの外側に、安全分類器・監視・fallback・政府評価・業界基準が重なる——これ全体が今の"モデル"

ここまで来ると、モデルの"仕様"は性能・価格・API名だけではなくなる。誰が使えるか、どの用途なら許されるか、どのリクエストが止まり、どのリクエストが格下げされるか。政府が何をテストしたか。そこまで含めて、モデルという製品の輪郭になっている。

05そも​そも、​「Fableだけが​危険」だったのか

ここは慎重に、両方の言い分を並べる。CAG自身が検証したわけではなく、公式説明と報道の再構成だという前提で読んでほしい。

停止のきっかけは、Amazonの報告で示されたある回避手法だったとAnthropicは説明している。報道(Wiredなど)によれば、それは「コードを直す(fix code)」ような経路を通る手法だったとされる。ただし、Amazonの報告そのものの全文は公開が確認できていない。だから技術的な詳細は、あくまで各社の記述からの再構成にとどまる。[7]

Anthropicの主張はこうだ。その挙動はFable 5だけの特別な能力ではない。Opus 4.8、GPT-5.5、Kimi K2.7といった他のモデルでも同じような脆弱性の発見や実証はできた、と。つまり「Fableが危険すぎたから止まった」という単純な図式ではない、というのがAnthropicの立場だ。

一方で、セキュリティ実務側からは別の声もある。Luta Securityは「今回止められた挙動は、防御側が日常的に使う『見つけて・直して・試す』ループに近い。それを止めると、守る側が損をする」と批判した。Cloudflareも、Glasswingで見えたMythos級の能力は、脆弱性を見つけるだけでなく「本当に悪用できるか」まで踏み込める、と実務視点で補足している。この能力は防御に役立つと同時に、攻撃にも使える。いわゆる dual-use(両用) だ。[8]

だから「政府の関与=悪」とも、「危ないモデルを止めて当然」とも、単純には言えない。守る側に必要な能力と、悪用が怖い能力が、同じ場所に同居している。この緊張こそが、今回の話のいちばんの肝だ。ここではどちらが正しいと評価はせず、報道された事実として両論を置いておく。

06これは​何を​意味するか​——モデルは​「運用物」に​なった

ここまでを一言でまとめると、こうなる。frontier model(最前線のAIモデル)は、リリースして終わりの製品ではなく、運用し続けるものになった。

昔のイメージでは、AIモデルは「発表され、価格とAPIが出て、あとは使うだけ」だった。いまは違う。政府が事前にテストし、安全分類器がリクエストを選別し、止めたものは格下げされ、監視が続き、業界で評価基準が作られる。止まることもあれば、条件付きで戻ることもある。

リリース物として(旧) 運用物として(今) 発表 価格・API 使うだけ 政府評価 分類器・監視 fallback・基準 モデル本体
左=発表して使うだけの一方通行。右=評価・監視・fallback・基準が回り続ける運用ループ。この違いが今回見えた

私たちCAG(電脳技巧集団)も、業務にAIを組み込む仕事のなかで、この変化を実感している。「いちばん賢いモデルを選んで終わり」ではなく、「そのモデルが止まったら何に切り替えるか」「危ない操作は誰が承認するか」「何を記録に残すか」を最初に決めておく。モデルは差し替え可能な働き手として扱い、止まっても仕事が続く土台のほうを作り込む——今回の再展開は、その考え方が現場で効くことを、あらためて裏づける教材になった。この視点は、以前CAGが書いた「最強モデルより強いharness(土台)を作れ」という記事とまっすぐつながっている。

harness-over-strongest-model 記事のサムネイル 関連記事 | 止まる時代の設計論「最強モデル」より「強いharness」──frontier AIが"政策で止まる"時代のエージェント設計

07使う​前に、​知って​おきたい​こと

最後に、Fable 5を実際に使う前提で、注意点を分かりやすく並べる。良いニュースほど、条件と限界をセットで見たほうがいい。

  • 「戻った=完全に元通り」ではない:安全分類器とfallbackが挟まった。同じ依頼でも、以前と挙動が違う瞬間がありうる。
  • 無害な依頼が巻き込まれることがある:Anthropic自身がfalse positive(誤検知)の増加を認めている。コーディングやデバッグでも、能力を落とした応答が返る場合がある。
  • Mythos 5は誰でも使えるわけではない:Glasswingなどの限定提供のまま。「戻った」のはあくまでFable 5だ。
  • 止まった理由の詳細は未確定:Amazonの報告全文も、政府指令の法的根拠も、公開情報では限られる。ここは「未検証」として扱うのが誠実だ。
  • 品質劣化の実測はこれから:fallbackがどれくらいの頻度で起き、コーディング品質やコストにどう効くかは、使いながら測るしかない。

要するに、Fable 5は「戻った強いモデル」であると同時に、「運用条件つきのモデル」になった。使うなら、性能だけでなく「どういう時に止まる・格下げされるか」まで見て設計しておくのが安全だ。派手な出来事に見えて、実際に残ったのは"AIモデルの見方そのものが変わった"という静かな地殻変動のほうだった。

同じモデルでも、「リリース物」として見るか「運用物」として見るかで、備え方が変わる。今回の学びを一枚に。

見る観点リリース物として見る(旧)運用物として見る(今)
何を見るか性能・価格・API名+政府評価・安全分類器・監視・fallback・業界基準
止まるか基本止まらない前提政策・輸出管理・trusted accessで止まりうる
拒否のされ方yes / no の二択能力を落として続ける(capability tiering)
誰が使えるか料金プラン次第国籍・組織・用途・安全判断で変わりうる
誰が関わるかベンダーと利用者+政府・パートナー・標準化団体
設計の焦点最強モデルを選ぶ止まっても回る土台(harness / BCP)を作る

※ 本記事はAnthropic公式発表および各報道(Wired / Business Insider / CSA / Luta Security / Cloudflare 等)を、AIを業務に使う側の観点から分かりやすく整理したもの。技術詳細・数値・経緯はすべて公式・報道の引用であり、CAG自身の検証結果ではない。停止理由の技術的詳細や政府指令の全文は公開確認できておらず、未確定部分を含む。政治的評価はせず、報道された事実の提示にとどめる(v0・2026-07時点)。

脚注・出典

  1. Anthropic「Redeploying Claude Fable 5」——2026年7月1日の再展開の一次情報。改善された安全分類器(停止のきっかけとされた特定手法を99%以上ブロック/false positive増加を自認)、Opus 4.8へのfallback、CAISIによる旧・新safeguardのテスト、業界共通のjailbreak深刻度フレームワーク構想を確認。anthropic.com/news/redeploying-fable-5
  2. 本記事は外部発表・報道の解説であり、CAGが開発・検証した制作事例ではない。能力・数値はすべて「公式発表・報道によれば」という前提で読まれたい。
  3. 停止と解除の経緯:2026-06-09発表、2026-06-12に米政府の輸出管理指令で全顧客停止、2026-06-30解除、2026-07-01再展開。出典:Anthropic「Statement on the US government directive to suspend access to Fable 5 and Mythos 5」および Anthropic「Redeploying Claude Fable 5」、複数報道。指令は「foreign national」向けだったが、国籍のリアルタイム判定が不可能なため全顧客停止で対応したとAnthropicが説明。anthropic.com/news/fable-mythos-access
  4. Opus 4.8 fallback:安全分類器がブロックしたFable 5リクエストは拒否されるのではなくOpus 4.8へ送られる(能力を落としたfallback)。出典:Anthropic「Redeploying Claude Fable 5」、Wired。wired.com
  5. CAISI(Center for AI Standards and Innovation, NIST):商用AIシステムのテスト・標準策定・国防/サイバー/バイオ/化学のリスク評価を担う政府側の窓口。Anthropicは旧・新safeguardをCAISIがテストしたと説明。CAISIの一般的役割はNIST公式ページで確認。nist.gov/caisi
  6. Fable 5とMythos 5の違い:同じ基盤モデルだが、Mythosは一部safeguardを外したtrusted access向けで、Project Glasswing(重要インフラの脆弱性発見・修正に使う限定プログラム。約150組織・15カ国超へ拡大)などに制限提供される。Fableは一般提供。再展開で戻ったのはFable 5であり、Mythos 5は一般開放されていない。出典:Anthropic「Claude Fable 5 and Claude Mythos 5」「Expanding Project Glasswing」。anthropic.com/news/expanding-project-glasswing
  7. 停止のきっかけとされるbypass:Amazonの報告で示された「fix code」経由の手法とされるが、Amazonの報告全文は公開確認できておらず、技術詳細はAnthropic・Wired等の記述からの再構成。出典:Wired、Business Insider「What smart people are saying about the return of Anthropic's Fable 5」。businessinsider.com
  8. セキュリティ実務側の視点:Luta Securityは輸出管理が防御側の find/fix/test ループを止めると批判。CloudflareはMythos Previewが脆弱性発見だけでなくproof generation/exploitability検証まで進める能力を持つ(dual-use)と補足。CSA Lab Spaceは今回の停止をmodel-tier redundancy・graceful degradation・regulatory-driven service interruptionの企業AIリスク管理事例として整理。出典:Luta Security「The Fable 5 Export Controls Harm US Cyber Defense」、Cloudflare Blog「Project Glasswing」、CSA Lab Space。lutasecurity.com

「AIが​止まったら、​うちの​業務は​どうなる?」——​その​備え、​一緒に​設計します。

最新モデルを追うだけでなく、止まっても回る土台(切り替え・承認・記録)まで含めて。毎日Claudeで作っている現場目線で、AI導入の設計からご一緒します。まずは相談から——問い合わせは、AIがその場でお応えします。

無料で相談する →

言語化できるものは、全て作る。

あなたの「作りたい」を、定価とスピードで形に。まずは無料の相談から。

制作事例を見る