Anthropic ripristina l'accesso a Claude Fable 5 e Mythos 5 dopo i blocchi governativi
Anthropic riattiva l'accesso globale a Claude Fable 5 e Mythos 5 dopo la revoca delle restrizioni USA con nuovi sistemi di sicurezza.
Anthropic ha annunciato il ripristino globale dell'accesso ai suoi modelli di intelligenza artificiale più avanzati, Claude Fable 5 e Claude Mythos 5, a seguito della revoca dei controlli sulle esportazioni imposti dal governo degli Stati Uniti. La decisione, effettiva dal 1° luglio 2026, mette fine a un periodo di sospensione cautelativa iniziato il 12 giugno, durante il quale l'azienda ha collaborato con le autorità per rafforzare i sistemi di sicurezza contro potenziali utilizzi malevoli in ambito cybersecurity.
Accesso ripristinato per Claude Fable 5 e Mythos 5 su tutte le piattaforme Anthropic e presto su AWS, Google Cloud e Microsoft Foundry.
Implementati nuovi classificatori di sicurezza per prevenire l'identificazione e lo sfruttamento di vulnerabilità software, con un'efficacia dichiarata superiore al 99%.
Anthropic, Google, Microsoft e Amazon hanno avviato lo sviluppo di un framework comune per valutare e classificare la gravità dei tentativi di bypass delle protezioni (jailbreak).
Il contesto del blocco e la risoluzione delle criticità
Secondo quanto riportato da Anthropic, il blocco temporaneo era stato innescato da una segnalazione di ricercatori Amazon, i quali avevano individuato un metodo per aggirare le protezioni di Fable 5. Tale tecnica permetteva al modello di identificare vulnerabilità software e, in un caso specifico, di generare codice per sfruttarle.
Sebbene i test successivi abbiano dimostrato che capacità simili fossero presenti anche in modelli concorrenti come GPT-5.5 e Kimi K2.7, Anthropic ha lavorato a stretto contatto con il Dipartimento del Commercio degli Stati Uniti per implementare salvaguardie più rigide.
La collaborazione con le istituzioni americane non è una novità per l'industria, viste le recenti discussioni sulla cessione di quote di OpenAI al governo degli Stati Uniti. Anthropic ha confermato che i nuovi classificatori di sicurezza sono stati testati dal Center for AI Standards and Innovation (CAISI), confermandone la robustezza.
Nuovi standard di sicurezza e collaborazione industriale
L'incidente ha evidenziato la mancanza di uno standard condiviso nel settore per valutare la pericolosità dei cosiddetti "jailbreak". Per colmare questa lacuna, Anthropic ha annunciato una partnership con Amazon, Microsoft e Google all'interno del programma Glasswing. L'obiettivo è creare un framework di valutazione basato su quattro criteri: guadagno di capacità, ampiezza del guadagno, facilità di utilizzo come arma e individuazione della tecnica.
Differenze tra Claude Fable 5 e Mythos 5
Anthropic ha chiarito che, sebbene i due modelli condividano la stessa architettura, Claude Fable 5 è progettato per l'uso generale con protezioni estremamente rigide (approccio "defense in depth"). Al contrario, Claude Mythos 5 presenta meno restrizioni ed è destinato esclusivamente a organizzazioni statunitensi selezionate per attività di cybersecurity difensiva. Per gli utenti Pro e Enterprise, l'accesso a Fable 5 sarà inizialmente incluso nei limiti di utilizzo settimanali, per poi passare a un sistema basato su crediti dopo il 7 luglio.
Collaborazione rafforzata con il governo USA
L'azienda ha formalizzato nuovi impegni per la sicurezza dell'IA di frontiera, che includono l'accesso anticipato ai modelli per i partner governativi prima del rilascio pubblico e la condivisione rapida di informazioni sui nuovi pattern di abuso. È stato inoltre lanciato un programma su HackerOne per consentire ai ricercatori di sicurezza di segnalare vulnerabilità nei sistemi di protezione di Claude Fable 5 in modo etico e controllato.
Fonte: Anthropic