Recenti rapporti resi noti da Cloudflare hanno puntato il dito verso Perplexity che, a quanto pare, si avvarrebbe di tecniche scorrette e tutt’altro che etiche per raccogliere i dati necessari all’addestramento dell’AI dai siti web. Le restrizioni messe in atto da diversi portali, infatti, sarebbero state facilmente aggirate.
Cloudflare ancora una volta contro Perplexity: cos’è successo stavolta?

Un’accusa pesante quella mossa da Cloudflare nei confronti di Perplexity che avvalendosi della tecnica dello stealth crowling riuscirebbe ad accedere a dati dei siti web che, altrimenti, sarebbero inaccessibili all’intelligenza artificiale. Ogni sito, infatti, utilizza il file robots.txt per dare, o meno, ai bot l’autorizzazione ad utilizzare i propri contenuti per l’addestramento.
Un vero e proprio blocco che, però, Perplexity sarebbe stata in grado aggirare fin troppo facilmente. Secondo il report, infatti, sarebbe bastato che il proprio crawler fingesse di essere un browser generico per scavalcare le protezioni non solo del file robots.txt ma anche quello dei firewall di Cloudflare. Ma non è tutto: Perplexity avrebbe anche modificato molto velocemente gli indirizzi IP e gli ASNs dei siti al fine di annullarne ogni meccanismo di difesa.
Una notizia che non dovrebbe stupire dato che Perplexity non è nuova a comportamenti di questo tipo. Appena un anno, infatti, è passato dalle ultime accuse da cui, però, l’azienda aveva saputo ben svincolarsi attribuendo ogni responsabilità a crawler terzi. Per ripulire la propria immagine, poi, si sarebbe accordata con diversi editori per la condivisione dei guadagni generati dalla pubblicità.
Mentre la vicenda sembra tutt’altro che chiusa, Cloudflare ha provveduto alla rimozione dei bot di Perplexity dalla sua lista di bot verificati.








