Balaji, che ha lasciato OpenAI ad agosto, si è espresso apertamente contro la pratica dell’azienda di intelligenza artificiale di addestrare il chatbot su materiale protetto da copyright copiato da Internet negli ultimi mesi. Il gigante dell’intelligenza artificiale (IA) ha combattuto diverse cause legali relative alle sue pratiche di raccolta dati.
Informazioni su Suchir Balaji
L’indiano americano Suchir Balaji è cresciuto a Cupertino, California. Un ragazzo straordinariamente sveglio, eccelleva nei concorsi di programmazione, piazzandosi 31° alle finali mondiali ACM ICPC 2018 e vincendo il primo posto nei Pacific Northwest Regional e Berkeley Programming Contest del 2017.
Balaji si è anche assicurato il 7° posto nella “Passenger Screening Algorithm Challenge” sponsorizzata dalla TSA di Kaggle, vincendo un premio di $ 100.000. Secondo il suo profilo LinkedIn, è stato campione nazionale degli US Open 2016 e finalista USACO.
Come la maggior parte degli altri nel suo campo, Balaji era stato affascinato dalla promessa dell’intelligenza artificiale fin da piccolo. In un’intervista rilasciata al New York Times in ottobre, ha detto che il suo interesse per l’IA è iniziato dopo essersi imbattuto in una notizia sulla tecnologia durante l’adolescenza e aver immaginato che le reti neurali potessero risolvere i più grandi problemi dell’umanità.
“Pensavo che l’intelligenza artificiale potesse essere utilizzata per risolvere problemi irrisolvibili, come curare malattie e fermare l’invecchiamento… Pensavo che avremmo potuto inventare una specie di scienziato che avrebbe potuto aiutarci a risolverli”, ha affermato, secondo il rapporto del NYT.
Anche prima di laurearsi, ha lavorato presso Scale AI, Helia ed è stato un Software Engineer presso Quora. Nel 2020, Balaji si è unito a un gruppo di laureati di Berkeley che sono andati a lavorare per OpenAI.
Il tempo di Suchir Balaji all’OpenAI
Ha lavorato presso OpenAI per quattro anni, durante i quali, per un anno e mezzo, ha contribuito a raccogliere e organizzare le enormi quantità di dati Internet che l’azienda ha utilizzato per creare il suo chatbot online, ChatGPT.
Balaji ha detto al NYT che durante i suoi dati iniziali su OpenAI, non ha considerato attentamente se l’azienda avesse il diritto legale di creare i suoi prodotti utilizzando sia dati protetti da copyright che dati Internet aperti. È stato solo dopo il rilascio di ChatGPT alla fine del 2022 che ha iniziato a riflettere sulla questione e si è reso conto che tecnologie come ChatGPT stavano danneggiando Internet utilizzando dati protetti da copyright, violando la legge nel processo.
Nel 2024, Balaji ha affermato di essersi reso conto di “non voler più contribuire a tecnologie che, a suo avviso, avrebbero portato alla società più danni che benefici”. Ha lasciato l’azienda nell’agosto di quest’anno senza un nuovo impiego e ha iniziato a lavorare a quelli che ha definito “progetti personali”.
È morto un giorno dopo essere stato citato in un fascicolo giudiziario come qualcuno nei cui file OpenAI avrebbe effettuato ricerche nell’ambito di una causa intentata da coloro che avevano citato in giudizio il gigante dell’intelligenza artificiale.
Accusa di Suchir Balaji contro OpenAI
Dopo aver lasciato OpenAI, Suchir Balaji si è espresso pubblicamente contro il modo in cui le aziende di intelligenza artificiale utilizzano dati protetti da copyright per creare le proprie tecnologie. Ha affermato che i modelli di intelligenza artificiale erano troppo dipendenti dal lavoro di altri, in quanto sono addestrati su materiale protetto da copyright prelevato da Internet senza autorizzazione.
“Questo non è un modello sostenibile per l’ecosistema di Internet nel suo complesso”, ha dichiarato al NYT .
Ha inoltre spiegato le sue preoccupazioni sul suo sito web personale , dove ha osservato che, sebbene i modelli generativi producano raramente output identici ai loro dati di addestramento, l’atto di replicare materiale protetto da copyright durante l’addestramento potrebbe violare le leggi se non fosse protetto dal “fair use”.
“Poiché il fair use viene determinato caso per caso, non è possibile fare affermazioni generali su quando l’intelligenza artificiale generativa possa essere considerata un fair use”, ha osservato.
Balaji ha sostenuto che in diversi casi i chatbot competono direttamente con le opere protette da copyright da cui hanno imparato. “I modelli generativi sono progettati per imitare i dati online, quindi possono sostituire “praticamente qualsiasi cosa” su Internet, dalle notizie ai forum online”, ha affermato.
Secondo lui, il problema più grande è che, poiché le tecnologie di intelligenza artificiale stanno gradualmente sostituendo i servizi Internet esistenti, a volte producono “informazioni false e talvolta completamente inventate, quelle che i ricercatori chiamano “allucinazioni””.
Internet, ha affermato, sta cambiando in peggio.
Accuse contro le aziende di intelligenza artificiale
Balaji non era il solo a preoccuparsi che le aziende di intelligenza artificiale facessero un uso improprio dei dati dei titolari di copyright per addestrare i loro chatbot. Diversi editori di notizie statunitensi e canadesi, tra cui il New York Times, hanno intentato cause legali contro OpenAI e il suo partner principale, Microsoft, sostenendo che hanno utilizzato milioni dei loro articoli per creare chatbot che ora competono con l’agenzia di stampa come fonte di informazioni affidabili.
Anche molti scrittori di best-seller, tra cui John Grisham, hanno intentato cause legali contro l’azienda.
OpenAI contesta le rivendicazioni
OpenAI ha contestato le affermazioni di Balaji, sostenendo che l’uso dei dati rispettava i principi del fair use e i precedenti legali.
“Costruiamo i nostri modelli di intelligenza artificiale utilizzando dati disponibili al pubblico, in un modo protetto da fair use e principi correlati, e supportati da precedenti legali di lunga data e ampiamente accettati. Consideriamo questo principio equo per i creatori, necessario per gli innovatori e fondamentale per la competitività degli Stati Uniti”, ha affermato OpenAI in una dichiarazione.
A novembre, l’azienda ha dichiarato alla BBC che il suo software è “basato sul fair use e sui principi internazionali correlati al copyright, che sono equi per i creatori e supportano l’innovazione”.
El magnicidio del general Igor Kirillov.....¿Con concomitancias con el magnicidio del almirante don Luis Carrero Blanco, el 20 de diciembre de 1973?
RispondiElimina¿Poca seguridad en calle Hermanos Bécquer? ¿Poca seguridad en Serrano 104? ¿Poca seguridad en Claudio Coello 104? ¿Cercanía de calle Serrano número 75?
RispondiElimina