È durato 18 giorni il blocco forzato di Claude Fable 5 e Claude Mythos 5, i modelli più avanzati di Anthropic. Il 30 giugno 2026 il Dipartimento del Commercio statunitense ha formalmente revocato le restrizioni, e da oggi mercoledì 1 luglio Fable 5 sarà nuovamente disponibile a livello globale sulla Claude Platform, Claude.ai, Claude Code e Claude Cowork (al momento in cui scriviamo non ancora, ma lo sarà nelle prossime ore).

Per chi ha i piani Pro, Max, Team e alcuni piani Enterprise, Fable 5 sarà incluso fino al 50% dei limiti di utilizzo settimanali fino al 7 luglio, dopodiché sarà accessibile tramite usage credits. Il ripristino su AWS, Google Cloud e Microsoft Foundry avverrà il prima possibile.

Segui TuttoTech.net su Google Discover

Pubblicità-34%roborock Qrevo S Pro
Amazon

roborock Qrevo S Pro

389,99€589,99€

Come si è arrivati al blocco: Amazon, la Casa Bianca e il jailbreak contestato

La storia inizia il 9 giugno 2026, quando Anthropic lancia Fable 5 e Mythos 5 due modelli che condividono la stessa architettura di base, ma con livelli di protezione molto diversi: Fable 5 destinato all’uso generale con safeguard robusti, Mythos 5 riservato a un ristretto gruppo di partner fidati del programma Glasswing per la cybersicurezza difensiva.

Solo tre giorni dopo il lancio, il 12 giugno, il governo americano emette una direttiva di controllo delle esportazioni. Il motivo ufficiale: ricercatori di Amazon avevano documentato una tecnica capace di aggirare i guardrail di Fable 5, inducendo il modello a identificare vulnerabilità software e, in un caso specifico, a produrre codice dimostrativo su come sfruttarle. Secondo il Wall Street Journal, conversazioni dirette tra il CEO di Amazon Andy Jassy e la Casa Bianca avrebbero contribuito a spingere verso la direttiva. Il consigliere AI della Casa Bianca David Sacks ha dichiarato che l’amministrazione aveva chiesto ad Anthropic di risolvere il problema o di ritirare il modello, e che di fronte al rifiuto del CEO Dario Amodei si era proceduto con il controllo delle esportazioni. Tra i fattori non ufficialmente confermati, anche il sospetto che un gruppo legato alla Cina avesse avuto accesso a Mythos 5, con il timore di un potenziale reverse engineering da parte di un avversario straniero.

Ad Anthropic sono stati concessi appena 90 minuti per conformarsi, e la società ha optato per portare entrambi i modelli completamente offline, sospendendo l’accesso a tutti gli utenti nel mondo inclusi molti suoi ricercatori interni nati all’estero, impossibilitati ad accedere al proprio prodotto.

Anthropic ha però contestato la proporzionalità della misura, dichiarando di non concordare sul fatto che il riscontro di un potenziale jailbreak ristretto debba comportare il ritiro di un modello commerciale distribuito a centinaia di milioni di persone, e avvertendo che uno standard simile applicato all’intera industria porterebbe di fatto al blocco di tutti i nuovi deployment.

Sul fronte negoziale, un dettaglio significativo: Tom Brown, co-fondatore di Anthropic, ha preso in mano le trattative con l’amministrazione Trump al posto di Amodei, che era finito nel mirino dell’amministrazione sia per le sue posizioni esplicite sulla sicurezza dell’AI sia per essere stato un sostenitore dichiarato di Kamala Harris alle elezioni del 2024. La lettera del Segretario al Commercio Howard Lutnick era indirizzata proprio a Brown, non ad Amodei.

I test di Anthropic e cosa ha rivelato il “jailbreak”

Durante le tre settimane di standoff, Anthropic ha condotto test approfonditi per valutare la reale gravità del bypass segnalato. I risultati sono significativi: modelli meno capaci tra cui Claude Opus 4.8, GPT-5.5 e Kimi K2.7 riuscivano a identificare le stesse vulnerabilità individuate da Fable 5 nel report di Amazon. Quanto alla dimostrazione di come sfruttare la singola vulnerabilità documentata, ogni modello testato era in grado di produrre la stessa risposta, inclusi Claude Haiku 4.5, Sonnet 4.6, Opus 4.6 e 4.7, fino a GPT-5.4, GPT-5.5 e Kimi K2.7.

La tecnica segnalata, dunque, non esponeva capacità offensive uniche a livello Mythos, ma riguardava un caso limite nei safeguard di Fable 5 un comportamento che rientrava nella soglia di sicurezza extra ampia deliberatamente configurata al lancio per massimizzare la cautela. Anthropic ha quindi sviluppato un classificatore di sicurezza migliorato, allenato specificamente a bloccare il comportamento descritto nel report, con un’efficacia superiore al 99% dei casi. I ricercatori del Center for AI Standards and Innovation (CAISI) del Dipartimento del Commercio hanno testato sia i vecchi che i nuovi safeguard, confermandone la robustezza straordinaria.

Il nuovo classificatore comporta anche un costo: un maggior numero di false positive su richieste benigne durante attività ordinarie di coding e debugging. Anthropic ha annunciato che continuerà a raffinare il sistema per ridurre questi inconvenienti nel tempo.

Anthropic annuncia il ritorno globale di Claude Fable 5 e Mythos 5: cosa è successo in questi 18 giorni 1

Verso un framework condiviso per valutare i jailbreak

Uno degli effetti più concreti di tutta questa vicenda è la spinta verso la creazione di uno standard industriale condiviso per valutare la gravità dei jailbreak AI uno standard che oggi semplicemente non esiste. Anthropic, insieme ad Amazon, Microsoft, Google e gli altri partner del programma Glasswing, ha iniziato a sviluppare un framework che propone di misurare ogni jailbreak su quattro criteri.

Il primo è il capability gain: quanto il jailbreak va oltre gli strumenti esistenti già disponibili? Se altri modelli meno capaci raggiungono lo stesso risultato, il punteggio è basso; se sblocca capacità che accelerano in modo significativo anche esperti del settore, il punteggio è alto. Il secondo è l’ampiezza del vantaggio: per quanti compiti offensivi distinti funziona la stessa tecnica? Il terzo è la facilità di uso come arma: quanto sforzo richiede trasformare il jailbreak in un attacco reale? Il quarto è la discoverability: quanto è facile ottenere la tecnica richiede conoscenze specialistiche o è già ampiamente disponibile online?

Per i jailbreak più gravi quelli in grado di causare, ad esempio, un impatto devastante su infrastrutture critiche o sistemi bancari Anthropic ha anticipato che inizierà immediatamente a dispiegare misure di mitigazione preliminari alla conferma della gravità, con un team dedicato al monitoraggio 24 ore su 24 7 giorni su 7. Per chi voglia contribuire a testare Fable 5, è stato nel frattempo lanciato un nuovo programma su HackerOne dedicato alla segnalazione di potenziali cyber jailbreak.

La collaborazione rafforzata con il governo statunitense

Nella lettera del 30 giugno, il Segretario Lutnick ha comunicato che la licenza di esportazione “non è più necessaria” per Fable 5 e Mythos 5, dopo che Anthropic ha accettato di rilevare e affrontare proattivamente i rischi di sicurezza, di collaborare sui protocolli per le release future e di segnalare qualsiasi attività malevola individuata nei propri modelli.

Gli impegni formali annunciati da Anthropic includono un accesso anticipato al governo per i modelli che avanzano in modo significativo la frontiera delle capacità in aree rilevanti per la sicurezza nazionale, con valutazioni indipendenti e test dei guardrail prima del rilascio pubblico. Sul fronte della condivisione delle informazioni, in caso di jailbreak significativi o pattern di abuso, Anthropic notificherà rapidamente le controparti governative, fornirà le nuove misure di sicurezza per test indipendenti e condividerà i report di threat intelligence prima della pubblicazione. È prevista infine la creazione di team dedicati alla ricerca congiunta, con una quota di risorse computazionali riservata a supportare testing e ricerca governativa.

Nel frattempo, lo scenario geopolitico più ampio rimane in rapida evoluzione: la Cina si sta avvicinando alla produzione di un proprio modello di classe Mythos, mentre OpenAI ha già annunciato il lancio della serie GPT-5.6 inizialmente solo per un piccolo gruppo di partner fidati, sotto pressione analoga da parte del governo americano. Le reazioni di Canada, India e Unione Europea hanno a loro volta rafforzato le richieste di sviluppo di AI sovrano, indipendente dalle grandi aziende tecnologiche statunitensi, ponendo una domanda che resterà aperta a lungo: quale precedente ha stabilito questa vicenda sull’approvazione governativa delle release di modelli frontier?