L'IA ha invaso il web: ormai i contenuti generati hanno superato quelli umani
La quantità di articoli generati da IA ha superato quella dei contenuti scritti da umani, ma ci sono anche buone notizie.
Uno studio ha rivelato che, a partire da novembre 2024, il numero di articoli generati dall'intelligenza artificiale pubblicati sul web ha superato quello degli articoli scritti da esseri umani. Tuttavia, la crescita di questi contenuti si è stabilizzata nell'ultimo anno, probabilmente a causa delle loro scarse prestazioni nei risultati di ricerca.
A meno di due anni dal lancio di ChatGPT, il panorama dei contenuti online è stato radicalmente trasformato: l'analisi, basata su un vasto campione di URL provenienti dall'archivio di CommonCrawl, mostra una crescita esponenziale dei contenuti AI a partire dal novembre 2022.
In soli dodici mesi, gli articoli generati artificialmente erano arrivati a costituire quasi il 39% di tutte le nuove pubblicazioni. Questa tendenza è stata spinta dalla necessità delle aziende di produrre contenuti in modo rapido ed economico per attrarre traffico, una strategia resa possibile dalla qualità sempre maggiore dei modelli linguistici.
Tuttavia, la corsa all'automazione sembra aver subito una battuta d'arresto. I dati mostrano che, a partire da maggio 2024, la proporzione di articoli generati dall'IA si è stabilizzata, senza continuare la sua crescita vertiginosa. Gli autori dello studio ipotizzano che questo plateau sia dovuto a una presa di coscienza da parte degli operatori del settore: nonostante la facilità di produzione, questi contenuti, se non supervisionati, tendono a performare male sui motori di ricerca come Google. Un'analisi separata, infatti, indica che la stragrande maggioranza di questi articoli non compare nei risultati di ricerca principali, suggerendo che, sebbene vengano prodotti in massa, la loro visibilità e il loro impatto reale sul pubblico siano molto limitati.
La metodologia dello studio è basata sull'algoritmo di rilevamento AI di Surfer per classificare un campione di 65.000 articoli. Per garantirne l'accuratezza, i ricercatori hanno valutato i tassi di errore: analizzando articoli pubblicati prima di ChatGPT, hanno stimato un tasso di falsi positivi (umani scambiati per IA) del 4,2%. Testando l'algoritmo su oltre 6.000 articoli generati con GPT-4o, hanno invece riscontrato un tasso di falsi negativi (IA scambiata per umani) di appena lo 0,6%.
Lo studio presenta comunque delle limitazioni: non prende in considerazione la prevalenza di contenuti "ibridi", ovvero generati dall'IA e poi revisionati da un umano, una pratica che potrebbe essere ancora più diffusa.
Fonte: Graphite.io