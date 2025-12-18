L’intelligenza artificiale continua a rappresentare una delle principali direttrici di sviluppo per le grandi aziende tecnologiche, ma allo stesso tempo sta diventando anche uno dei terreni più delicati dal punto di vista legale; in questo contesto si inserisce la nuova causa che vede protagonista Adobe, colpita da una proposta di class action negli Stati Uniti per il presunto utilizzo improprio di opere protette da copyright nella formazione dei propri modelli di intelligenza artificiale.

Secondo le accuse, l’azienda avrebbe utilizzato libri piratati per addestrare uno dei suoi modelli linguistici, senza il consenso degli autori coinvolti. Si tratta del primo caso di questo tipo contro Adobe, ma arriva in un momento in cui l’industria tech è già fortemente sotto pressione per pratiche simili.

Adobe sotto accusa per l’utilizzo non autorizzato di materiale protetto da copyright

La class action è stata presentata per conto di Elizabeth Lyon, scrittrice dell’Oregon specializzata in manuali didattici sulla scrittura e la promozione di opere di narrativa; secondo quanto riportato nella denuncia, Adobe avrebbe utilizzato copie pirata di numerosi libri per addestrare il modello SlimLM.

Adobe descrive SlimLM come una famiglia di modelli linguistici di piccole dimensioni, pensati per essere ottimizzati su dispositivi mobili e per supportare attività di assistenza documentale. L’azienda ha dichiarato che SlimLM è stato pre-addestrato su SlimPajama-627B, un dataset open source rilasciato da Cerebras nel giugno 2023; ed è proprio qui che nasce il nodo centrale della controversia.

Secondo la causa, SlimPajama sarebbe una copia derivata dal dataset RedPajama, ottenuta copiando e manipolando quest’ultimo; RedPajama, a sua volta, includerebbe Books3, una raccolta di circa 191.000 libri diventata ormai tristemente famosa per le numerose dispute legate all’utilizzo di materiale protetto da copyright nei sistemi di intelligenza artificiale.

Nella denuncia si legge che, essendo SlimPajama una derivazione di RedPajama, includerebbe inevitabilmente anche Books3, e quindi le opere protette da copyright di Lyon e di altri autori che fanno parte della class action.

In altre parole, secondo l’accusa, Adobe avrebbe beneficiato indirettamente di dataset contenenti materiale piratato, utilizzandoli come base per l’addestramento dei propri modelli linguistici.

Il caso di Adobe non è l’unico, negli ultimi mesi RedPajama e Books3 sono stati citati in numerose cause legali intentate contro aziende tecnologiche; a settembre una causa contro Apple ha sostenuto che l’azienda avesse utilizzato materiale protetto da copyright per addestrare Apple Intelligence senza consenso né compenso, a ottobre accuse simili sono state rivolte a Salesforce.

Più in generale, le cause legali legate ai dati di addestramento dell’IA stanno diventando sempre più frequenti; gli algoritmi di intelligenza artificiale vengono infatti addestrati su enormi dataset e, in molti casi, è emerso che questi potrebbero includere contenuti piratati o utilizzati senza autorizzazione.

Uno dei casi più rilevanti riguarda Anthropic, che a settembre ha accettato di pagare 1,5 miliardi di dollari per chiudere una class action intentata da diversi autori. L’azienda era accusata di aver utilizzato versioni pirata delle loro opere per addestrare il chatbot Claude; l’accordo è stato considerato un potenziale punto di svolta nelle battaglie legali sul copyright applicato all’IA, ed è proprio alla luce di questo precedente che la causa contro Adobe assume un peso particolare.

La denuncia, depositata presso il tribunale distrettuale degli Stati Uniti per il distretto settentrionale della California, è stata presentata per conto di tutti i titolari di copyright le cui opere sarebbero state utilizzate impropriamente da Adobe. Lyon chiede al tribunale un risarcimento danni di importo non specificato, aprendo la strada a un contenzioso che potrebbe avere ripercussioni significative non solo per Adobe, ma per l’intero settore del software basato sull’intelligenza artificiale. Al momento, Adobe non ha rilasciato commenti ufficiali sulla causa, così come no hanno risposto alle richieste di chiarimento né Lyon né il suo avvocato.

Il caso Lyon contro Adobe rappresenta un ulteriore tassello in una disputa ormai sistemica tra innovazione tecnologica e tutela del diritto d’autore. Se da un lato l’industria spinge verso modelli sempre più avanzati e performanti, dall’altro cresce la pressione affinché i dati di addestramento siano trasparenti, autorizzati e correttamente compensati.

Come spesso accade in questi casi, saranno i tribunali a dover stabilire dove finisce l’uso legittimo dei dati e dove inizia l’abuso; nel frattempo, le aziende che investono massicciamente sull’IA dovranno fare i conti con un quadro legale sempre più complesso, destinato a influenzare in modo profondo lo sviluppo futuro dell’intelligenza artificiale.