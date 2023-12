Il New York Times, uno dei giornali più letti al mondo, ha fatto causa a OpenAI e Microsoft per violazione del copyright, sostenendo cioè che le due aziende hanno usato illegalmente milioni di articoli per addestrare i modelli di intelligenza artificiale. Non ci sono riferimenti precisi all’entità del risarcimento richiesto, ma si legge che i danni al giornale ammonterebbero a “miliardi di dollari”.

OpenAI e Microsoft sotto accusa: articoli del Times usati per addestrare gli LLM

OpenAI e Microsoft avrebbero addestrato i loro modelli linguistici di grandi dimensioni (LLM), cioè quelli che alimentano ChatGPT e Copilot, copiando e usando milioni di articoli del New York Times senza averne diritto. Questo è quanto sostiene il noto giornale statunitense, che si dichiara danneggiato per miliardi di dollari e chiede alla corte di impedire alle due aziende di addestrare i propri modelli di intelligenza artificiale usando i suoi contenuti con effetto retroattivo, cioè rimuovendoli anche dai set di dati di OpenAI e Microsoft.

ChatGPT e Copilot “possono generare delle risposte che recitano testualmente i contenuti del Times, li riassumono fedelmente e ne imitano lo stile”, fatto che, secondo la denuncia, danneggia il rapporto fra giornale e lettori, rendendo così pubblici anche i contenuti protetti dal paywall, cioè accessibili se non pagando un abbonamento.

Il New York Times, quotidiano che già negli scorsi mesi aveva bloccato il web crawler di OpenAI, impedendogli cioè di continuare a estrarre contenuti dal suo sito web per addestrare i modelli di intelligenza artificiale, ha detto di aver provato a negoziare con entrambe le società con l’obiettivo di ottenere il giusto riconoscimento e valore per l’uso dei suoi contenuti, pur senza risultati, fatto da cui ne è conseguita la denuncia in questione per violazione del copyright.

Non è la prima volta che OpenAI viene accusata di simili violazioni, anche di aver addestrato illegalmente i suoi modelli linguistici con contenuti di autori di romanzi come John Grisham, George R. R. Martin e Jonathan Franzen. D’altro lato ci sono pure agenzie di stampa come Associated Press e un editore come Axel Springer SE di Bild, Business Insider e Politico che, di recente, hanno stretto accordi commerciali con OpenAI, consentendo cioè a ChatGPT di estrarre per i prossimi due anni informazioni direttamente dai contenuti pubblicati da questi ultimi.

Per maggiori informazioni, qui c’è il documento completo della causa del New York Times contro OpenAI e Microsoft.

