Perplexity nella bufera: scraping AI non autorizzato, secondo Cloudflare
In un post di ricerca, Cloudflare ha puntato il dito contro la startup, che avrebbe aggirato i blocchi Robots.txt mascherando i suoi bot. Perplexity nega e parla di "mossa commerciale".

La startup di intelligenza artificiale Perplexity è stata accusata da Cloudflare, gigante delle infrastrutture internet, di effettuare scraping di contenuti da siti web che hanno esplicitamente negato il consenso. In un post di ricerca pubblicato lunedì, Cloudflare sostiene che Perplexity stia ignorando deliberatamente i blocchi e nascondendo le sue attività di crawling per raccogliere dati.
Secondo i ricercatori, Perplexity starebbe aggirando le preferenze dei siti web, espresse tramite il file Robots.txt, modificando l'identità dei suoi bot.
Nello specifico, l'azienda agirebbe cambiando lo user agent del crawler per impersonare un browser comune (come Google Chrome su macOS) e alterando le sue reti di sistema autonomo (ASN) per non essere riconosciuta.
Cloudflare afferma di aver osservato questa attività su decine di migliaia di domini, con milioni di richieste al giorno, dopo aver ricevuto lamentele dai propri utenti.
La risposta di Perplexity non si è fatta attendere. Il portavoce Jesse Dwyer ha liquidato il post di Cloudflare come una trovata commerciale ("sales pitch"), aggiungendo che gli screenshot non mostrano alcun accesso ai contenuti e che il bot citato "non è nemmeno nostro".
Questa non è la prima controversia per Perplexity, già accusata in passato di plagio da testate come Wired.
Da parte sua, Cloudflare ha recentemente intensificato la sua battaglia contro lo scraping aggressivo da parte delle IA, lanciando strumenti per bloccare i bot e un marketplace per consentire agli editori di addebitare un costo ai crawler. In risposta a questa indagine, Cloudflare ha rimosso i bot di Perplexity dalla sua lista di crawler verificati e ha implementato nuove tecniche per bloccarli.
Fonte: TechCrunch