OpenAI, l’azienda che ha già rivoluzionato il mondo con ChatGPT, ha da poco annunciato Sora, un nuovo modello di intelligenza artificiale capace di generare un video di un minuto partendo da una descrizione testuale, il cosiddetto “prompt”.

L’azienda spiega che Sora è in grado di generare scene complesse con più personaggi che si muovono con coerenza nella scena e con dettagli accurati sia del soggetto che dello sfondo.

OpenAI aggiunge che il modello comprende non solo quello che l’utente chiede attraverso il prompt, ma anche come il tutto esiste nel mondo fisico.

Sora è in grado di generare video realistici lunghi fino a un minuto

Sul sito ufficiale la società ha condiviso alcuni video sfornati da Sora, uno dei quali mostra una donna che cammina lungo una strada di Tokyo, mentre un altro mostra una galleria d’arte, inoltre si vede una persona che corre su un tapis roulant in un video girato in 35 mm e in un altro c’è un cane che guarda Burano dalla finestra.

OpenAI afferma che Sora genera il risultato in base a una profonda comprensione del linguaggio, che gli consente di interpretare accuratamente ciò che l’utente ha scritto nel prompt, tuttavia il modello non è ancora perfezionato.

Come praticamente tutti i generatori di immagini e video creati dall’IA, l’azienda spiega che anche Sora può omettere particolari chiave, introdurre qualcosa di incoerente e fraintendere causa ed effetto.

Tuttavia attualmente nessuno strumento del genere è in grado di generare video lunghi fino a 60 secondi, inoltre Sora genera interi video, non una successione di fotogrammi, garantendo che i soggetti rimangano sempre gli stessi.

Anche se non privi di imperfezioni, i video presenti sul sito ufficiale di OpenAI sono già alquanto impressionanti in quanto a realismo, motivo per il quale Sora, che significa “cielo” in giapponese, è attualmente disponibile per un piccolo gruppo di accademici e ricercatori che valuteranno i rischi del caso e il suo potenziale uso improprio.

OpenAI ha affermato che Sora è stato addestrato utilizzando sia video disponibili al pubblico sia video concessi in licenza dai detentori del copyright.

Potrebbe interessarti: ChatGPT usato per attacchi informatici, rischi e soluzioni secondo Microsoft e OpenAI