CNN, ABC e altri giganti mediatici chiudono le porte al data scraping: scopri i motivi dietro questa decisione!

0

Il primo scandalo legato all’intelligenza artificiale sembra essere scoppiato. Se la presunta causa del New York Times contro OpenAI è stata solo un anticipo, ciò che è accaduto di recente sembra essere un vero e proprio terremoto: numerose testate internazionali hanno deciso di bloccare l’accesso ai propri contenuti a GPTBot di OpenAI.

GPTBot è un bot che raccoglie contenuti per ChatGPT. Si tratta di un programma di data scraping utilizzato da OpenAI per reperire materiale disponibile online e utilizzarlo per addestrare la propria intelligenza artificiale. Fino ad ora, GPTBot ha raccolto dati da diverse fonti sul web, arrivando perfino a includere opere protette da copyright, come i libri di Stephen King e gli articoli del New York Times e di molte altre testate online.

Tuttavia sembra che questa pratica stia per terminare: dopo che il New York Times ha rivisto le sue condizioni generali per gli utenti, impedendo il data scraping dei suoi articoli senza il consenso esplicito dell’editore, molte altre testate stanno seguendo la stessa strada. Tra queste ci sono la CNN, Reuters, la ABC, l’Australian Community Media (ACM) – che possiede i principali giornali dell’Australia, come il Canberra Times e il Newcastle Herald – e persino il Chicago Tribune.

Di fatto, alcuni dei più importanti giornali mondiali, sia americani che australiani, stanno bloccando l’accesso ai loro contenuti alle aziende che lavorano sull’intelligenza artificiale, a partire da OpenAI. Rimane da capire come OpenAI reagirà a questo problema: una possibile soluzione potrebbe essere la ricerca di contratti e partnership con alcuni dei giornali che hanno bloccato GPTBot, anche se questa opzione comporterebbe costi maggiori. Altrimenti, potrebbero semplicemente rivolgersi ad altre fonti per i propri dataset, ma con i rischi che questa scelta comporta, considerando l’abbandono dei giornali più autorevoli del pianeta.

Nel frattempo, OpenAI non ha preso posizione sulla questione: al contrario, in un post sul proprio blog di pochi giorni fa, l’azienda ha spiegato che “permettere l’accesso di GPTBot al tuo sito può aiutare i modelli di intelligenza artificiale a diventare più accurati, migliorandone le capacità e la sicurezza in generale”.

CNN, ABC e tanti altri bloccano il data scraping di ChatGPT

Un gran numero di testate internazionali hanno bloccato l’accesso a GPTBot, un bot utilizzato da OpenAI per raccogliere dati per la formazione del suo modello di intelligenza artificiale ChatGPT. GPTBot ha raccolto dati anche da fonti protette da copyright, come i libri di Stephen King e gli articoli del New York Times. Dopo che il NYT e altre testate hanno rivisto le loro condizioni per impedire il data scraping dei loro articoli senza consenso, molte altre testate, tra cui CNN, Reuters, ABC e ACM, stanno seguendo la stessa strada. Questo pone OpenAI di fronte a diverse possibilità, come la ricerca di partnership con i giornali o l’utilizzo di altre fonti per i propri dataset. OpenAI non ha ancora preso posizione sulla questione.