Un paio di mesi fa OpenAI è tornata a stupire il mondo con Sora, un modello di intelligenza artificiale in grado di generare video realistici a partire da un input testuale.

La tecnologia sembra incredibile, tuttavia c’è un lato oscuro che riguarda l’intelligenza artificiale generativa, poiché questi sistemi vengono addestrati con tonnellate di dati presenti sul Web.

Quando è stata intervistata dal Wall Street Journal il mese scorso, Mira Murati, CTO di OpenAI, non era sicura della provenienza dei dati di addestramento per Sora.

Google avvisa OpenAI: utilizzare i video di YouTube per addestrare Sora e ChatGPT non è consentito

Visto che non è chiaro se i video di YouTube vengono utilizzati per la formazione di Sora, il CEO di YouTube Neal Mohan ora ha avvisato OpenAI che l’utilizzo di video sulla sua piattaforma non è consentito, poiché tale pratica sarebbe una chiara violazione dei termini di servizio della stessa.

Anche Google, la società madre di YouTube, sta sviluppando la sua intelligenza artificiale multimodale chiamata Gemini, che viene anch’essa addestrata con un’enorme quantità di dati, ma nell’intervista con Emily Chang su Bloomberg Originals, Mohan ha affermato che Google rispetta i contratti individuali di YouTube con i creator prima di decidere se utilizzare i video della piattaforma.

Sarà interessante vedere se OpenAI chiarirà esattamente come sta formando Sora, presupponendo che l’azienda sia in grado di stabilirlo con accuratezza, cosa che potrebbe eventualmente dover fare se intende consentire al pubblico l’uso dei suoi strumenti.

La questione relativa a come vengono addestrati i vari modelli di intelligenza artificiale è un problema che riguarda tutte le aziende coinvolte in questa rivoluzione tecnologica epocale.