Tre scrittori denunciano NVIDIA: avrebbe addestrato l'AI con un database pirata

NVIDIA finisce sotto accusa. A puntare il dito sono gli scrittori Abdi Nazemian, Brian Keene e Stewart O’Nan, secondo cui il colosso tecnologico avrebbe fatto un uso illegale della loro opera, violando le leggi a tutela del diritto d’autore.

Più nello specifico, NVIDIA avrebbe avrebbe dato in pasto il database Books3 alla sua AI NeMo, il framework proprietario per lo sviluppo, la modifica e la distribuzione di piattaforme LLM (Large Language Model) come i chatbot.

Un database da 200.000 libri pirata

Secondo la ricostruzione fornita dai promotori della class action depositata presso la corte federale di San Francisco, Books3 conterrebbe quasi 200.000 libri piratati (tra cui, ovviamente, quelli dei tre autori protagonisti), e non a caso sarebbe stato reso inaccessibile dalla community AI Hugging Face su cui in precedenza, ovvero fino ad ottobre 2023, era invece possibile ottenerlo.

NVIDIA avrebbe quindi scaricato il database e sempre secondo l’accusa ne avrebbe prodotto svariate copie al fine di addestrare alla scrittura l’AI di NeMo, violando così il copyright delle opere incluse nel pacchetto pirata. Da Hugging Face hanno però fatto sapere di non aver mai rimosso il dataset, perché semplicemente questo non sarebbe mai stato ospitato dal sito.

Su Hugging Face ci sarebbe stato piuttosto solo uno script che avviava il download da un’altra fonte, The Eye, da dove successivamente il dataset incriminato è stato rimosso, generando il messaggio di errore che potete leggere nell’immagine qui sopra.

Offerta

Tre scrittori denunciano NVIDIA: avrebbe addestrato l'AI con un database pirata 1

Apple iPhone 15 (128 GB)

749€ invece di 979€

-23%

Amazon 🛒

Al di là di questi dettagli, l’accusa contro NVIDIA comunque è chiara, e cioè di essere entrata in possesso in un modo o nell’altro di un dataset pirata, e di averne disposto per il proprio ritorno economico.

La risposta di NVIDIA

L’azienda non è stata a guardare e si è affrettata a replicare, affidando la propria risposta al Wall Street Journal:

“Rispettiamo i diritti di tutti i creatori di contenuti e riteniamo di aver creato NeMo nella piena osservanza della leggi relative al copyright.”

Insomma, come prevedibile NVIDIA respinge la accuse al mittente. I tre autori che le hanno fatto causa, nel frattempo, si augurano invece che arrivi velocemente un verdetto ad interrompere la distribuzione di NeMo.

AI e copyright: un terreno scivoloso

Gli scontri sul campo dell’intelligenza artificiale sono destinati a moltiplicarsi nei prossimi mesi ed anni. La posta in gioco è altissima, e coinvolge moltissimi aspetti della vita e dei commerci umani, produzione artistica inclusa.

Gli autori, come in questo caso, non solo temono di poter essere presto rimpiazzati per gran parte dalle AI, ma che questo processo distruttivo possa essere nutrito per paradosso dalle loro stesse opere. Siamo oltre “l’opera d’arte nell’epoca della sua riproducibilità tecnica” di benjaminiana memoria, e ci addentriamo semmai nel territorio dell’artista nell’epoca della sua riproducibilità tecnica.

In Europa solo lo scorso dicembre è arrivata una prima regolamentazione sul tema, ma l’evoluzione del settore è così rapida e pervasiva che è facile ipotizzare ulteriori interventi già nel breve periodo.

NVIDIA, da par suo, sicuramente è consapevole che questa è solo una delle tante battaglie che dovrà combattere su questo fronte, assieme alle altre potenze dell’industria.

Se oggi è la quarta azienda più ricca del mondo, tanto lo deve all’intelligenza artificiale, a NeMo e al chip H100 che alimenta la maggior parte dei modelli attuali, a partire da ChatGPT. In una vicenda analoga a quella che coinvolge NVIDIA, il popolare chatbot è stato citato in causa dal New York Times, che accusa OpenAI e Microsoft di aver sfruttato gli articoli del giornale per addestrare l’intelligenza artificiale.