Enterprise

Fable di Anthropic ha troppi limiti di sicurezza, dicono gli esperti di cybersecurity

Il nuovo modello IA per la cybersecurity di Anthropic, Fable, è ritenuto troppo restrittivo da diversi esperti di cybersicurezza.

Dario Ribarni

11 giu 2026 — 2 minuti di lettura

Secondo gli esperti di cybersecurity, Anthropic ha implementato dei limiti di sicurezza troppo restrittivi per il modello Fable

Anthropic ha recentemente rilasciato Fable, presentato come una versione pubblica e limitata del suo potente modello di intelligenza artificiale dedicato alla cybersecurity, Mythos. Tuttavia, il debutto non è stato accolto favorevolmente da tutta la comunità tecnica. Numerosi ricercatori e professionisti della sicurezza informatica hanno infatti espresso forti perplessità riguardo alle restrizioni implementate da Anthropic, ritenute eccessivamente rigide per permettere uno svolgimento efficace del lavoro di analisi e difesa digitale. Esperti del settore, tra cui Valentina Palmiotti di IBM X-Force, hanno evidenziato come Fable tenda a rifiutare sistematicamente qualsiasi richiesta che sia anche solo latamente legata all'ambito informatico. Situazioni paradossali si verificano quando il sistema blocca operazioni quotidiane e del tutto innocue, come la lettura di un post su un blog tecnico o la richiesta di una semplice revisione del codice.

Quando un comando attiva i protocolli di protezione, l'IA interrompe la conversazione segnalando potenziali rischi legati alla sicurezza informatica o a temi biologici, impedendo di fatto l'esecuzione di compiti standard di ingegneria del software. Le motivazioni dietro queste barriere risiedono nella volontà di Anthropic di prevenire l'uso della propria tecnologia per lo sviluppo di malware o armi biologiche, una preoccupazione che l'azienda nutre da tempo. Tuttavia, l'attuale implementazione dei filtri appare a molti esperti come approssimativa e basata su semplici parole chiave. Matt Suiche, veterano della cybersecurity, ha spiegato che se viene chiesto al modello di scrivere codice sicuro seguendo le migliori pratiche, il sistema spesso declassa automaticamente la sessione a una versione meno potente dell'IA, interpretando erroneamente il contesto tecnico come un tentativo di violazione.

Nonostante il malumore, alcuni osservatori considerano comprensibile questo approccio iniziale estremamente cauto. Secondo diversi esperti, è probabile che Anthropic affinerà questi parametri nel tempo attraverso una collaborazione più stretta con i professionisti del settore. Al momento, l'azienda offre una parziale soluzione tramite il Cyber Verification Program, un percorso di accreditamento che consente ai ricercatori approvati di utilizzare gli strumenti IA con un numero inferiore di limitazioni. Resta però da vedere quanto velocemente questi modelli riusciranno a distinguere tra una minaccia reale e le legittime necessità operative degli esperti di difesa.

Fonte: techcrunch.com

Fable di Anthropic ha troppi limiti di sicurezza, dicono gli esperti di cybersecurity

Dario Ribarni

Leggi di più

Intel Nova Lake: trapelano i dettagli sulle GPU integrate Xe3P

Nintendo: batterie sostituibili per Switch 2 e stop alle vendite in Europa dal 2027 per Switch

Xbox annuncia il taglio di 3.200 posti di lavoro e la cessione di quattro studi

Dragon Ball Xenoverse 3: svelati dettagli su storia, gameplay e uscita