OpenAI, la società responsabile della creazione di ChatGPT, si trova in seri guai. Due scrittori, Paul Tremblay e Mona Awad, hanno intentato una causa contro di loro, accusandoli di aver utilizzato i loro articoli per addestrare il chatbot senza autorizzazione. La vicenda è attualmente in corso presso il tribunale di San Francisco, che dovrà stabilire la veridicità delle accuse.
OpenAI afferma che il set di dati utilizzato per addestrare ChatGPT è stato prelevato da un documento del 2020 pubblicato sul proprio sito web. Tuttavia, gli autori sostengono che i loro scritti siano stati acquisiti e inclusi nel set di dati attraverso l’utilizzo di “biblioteche ombra” come Library Genesis e Sci-Hub, che consentono il download di file torrent contenenti materiale protetto da copyright.
Questa controversia solleva una questione spinosa nell’ambito dell’intelligenza artificiale. Le “biblioteche ombra” sono state a lungo oggetto di interesse nella comunità dell’apprendimento automatico, ma il loro utilizzo solleva preoccupazioni sul rispetto del diritto d’autore. OpenAI non ha ancora commentato ufficialmente su questa situazione.
Va sottolineato che questa non è la prima volta che OpenAI affronta accuse simili. Lo scorso anno, l’azienda è stata oggetto di diverse denunce riguardanti l’utilizzo dei propri strumenti per l’apprendimento del chatbot. Inoltre, di recente è stata revocata la protezione del copyright a un’opera generata dall’intelligenza artificiale in una graphic novel. Questi eventi dimostrano quanto sia complicato per OpenAI farsi strada in un mondo che non è ancora pronto ad accogliere l’intelligenza artificiale a braccia aperte.
Due scrittori accusano OpenAI di aver utilizzato set di dati illegali per addestrare ChatGPT
Due scrittori hanno denunciato OpenAI, l’azienda che ha creato ChatGPT, accusandola di aver utilizzato i loro articoli per addestrare il chatbot. La causa per violazione del copyright è stata avviata da Paul Tremblay e Mona Awad, autori di libri horror. Sarà il tribunale di San Francisco a decidere chi ha ragione. OpenAI sostiene che il set di dati utilizzato è stato tratto da un documento pubblicato sul suo sito nel 2020, ma gli autori affermano che i loro materiali sono stati reperiti da “biblioteche ombra” come Library Genesis e Sci-Hub, che permettono di scaricare contenuti protetti da copyright. Questo non è il primo caso del genere per OpenAI. Inoltre, di recente è stata revocata la protezione del copyright a un’opera generata dall’intelligenza artificiale in una graphic novel. Queste controversie dimostrano quanto sia difficile per OpenAI affermarsi in un mondo ancora restio ad accogliere l’intelligenza artificiale.