Fable di Anthropic ha troppi limiti di sicurezza, dicono gli esperti di cybersecurity

Il nuovo modello IA per la cybersecurity di Anthropic, Fable, è ritenuto troppo restrittivo da diversi esperti di cybersicurezza.

Fable di Anthropic ha troppi limiti di sicurezza, dicono gli esperti di cybersecurity
Secondo gli esperti di cybersecurity, Anthropic ha implementato dei limiti di sicurezza troppo restrittivi per il modello Fable

Anthropic ha recentemente rilasciato Fable, presentato come una versione pubblica e limitata del suo potente modello di intelligenza artificiale dedicato alla cybersecurity, Mythos. Tuttavia, il debutto non è stato accolto favorevolmente da tutta la comunità tecnica. Numerosi ricercatori e professionisti della sicurezza informatica hanno infatti espresso forti perplessità riguardo alle restrizioni implementate da Anthropic, ritenute eccessivamente rigide per permettere uno svolgimento efficace del lavoro di analisi e difesa digitale. Esperti del settore, tra cui Valentina Palmiotti di IBM X-Force, hanno evidenziato come Fable tenda a rifiutare sistematicamente qualsiasi richiesta che sia anche solo latamente legata all'ambito informatico. Situazioni paradossali si verificano quando il sistema blocca operazioni quotidiane e del tutto innocue, come la lettura di un post su un blog tecnico o la richiesta di una semplice revisione del codice.

Quando un comando attiva i protocolli di protezione, l'IA interrompe la conversazione segnalando potenziali rischi legati alla sicurezza informatica o a temi biologici, impedendo di fatto l'esecuzione di compiti standard di ingegneria del software. Le motivazioni dietro queste barriere risiedono nella volontà di Anthropic di prevenire l'uso della propria tecnologia per lo sviluppo di malware o armi biologiche, una preoccupazione che l'azienda nutre da tempo. Tuttavia, l'attuale implementazione dei filtri appare a molti esperti come approssimativa e basata su semplici parole chiave. Matt Suiche, veterano della cybersecurity, ha spiegato che se viene chiesto al modello di scrivere codice sicuro seguendo le migliori pratiche, il sistema spesso declassa automaticamente la sessione a una versione meno potente dell'IA, interpretando erroneamente il contesto tecnico come un tentativo di violazione.

Nonostante il malumore, alcuni osservatori considerano comprensibile questo approccio iniziale estremamente cauto. Secondo diversi esperti, è probabile che Anthropic affinerà questi parametri nel tempo attraverso una collaborazione più stretta con i professionisti del settore. Al momento, l'azienda offre una parziale soluzione tramite il Cyber Verification Program, un percorso di accreditamento che consente ai ricercatori approvati di utilizzare gli strumenti IA con un numero inferiore di limitazioni. Resta però da vedere quanto velocemente questi modelli riusciranno a distinguere tra una minaccia reale e le legittime necessità operative degli esperti di difesa.

Fonte: techcrunch.com