Il programma di sviluppo di Open AI non si ferma: l’azienda, infatti, ha appena annunciato il nuovo modello GPT-4o (dove la “o” è un’abbreviazione di “omni”). Si tratta di un passo in avanti ulteriore per l’intelligenza artificiale di Open AI che ora diventa ancora più avanzata grazie alla possibilità di elaborare, in tempo reale, non solo input di testo ma anche audio e video.

In questo modo, l’utente potrà interagire in modo ancora più completo con l’intelligenza artificiale. Il nuovo modello, stando a quanto postato da Sam Altman su X, è “nativamente multimodale“. È interessante notare la scelta di Open AI che ha svelato la nuova evoluzione della sua IA precedendo di qualche ora la partenza di Google I/O dove Google dovrebbe mostrare le nuove evoluzioni di Gemini. Nel frattempo, Open AI ha rilasciato la prima app desktop per ChatGPT, ora disponibile su macOS.

GPT-4o: l’innovazione di Open AI non si ferma

Secondo Open AI, GPT-4o è un nuovo passo in avanti verso un’interazione sempre più profonda tra uomo e computer, con la possibilità di creare un dialogo naturale, sfruttando la combinazione di vari input. Come mostrato nel video demo pubblicato sul sito ufficiale, GPT-4o è in grado di combinare testo, audio e video andando a generare, contestualmente, qualsiasi combinazione di input, anche in questo caso considerando testo, audio e video.

La risposta agli input audio è incredibile: in media si arriva a 320 millisecondi, un valore molto simile al tempo di risposta umano in una conversazione. Nello stesso tempo, GPT-4o pareggia GPT-5 Turbo per quanto riguarda le prestazioni su testo in inglese e codice e migliora, in modo significativo, sul testo in lingue diverse dall’inglese oltre che nella comprensione dell’audio e di immagini e video.

Open AI ha confermato, inoltre, l’implementazione di GPT-4o in ChatGPT a partire da oggi, per quanto riguarda testo e immagini, in modo gratuito per tutti gli utenti. Per gli utenti Plus, sarà possibile utilizzare il nuovo modello con un limite di messaggi superiore di 5 volte. Successivamente, nel corso delle prossime settimane, è prevista l’implementazione della modalità vocale del nuovo modello, che sarà disponibile in versione alpha in ChatGPT. C’è, quindi, ancora molto lavoro da fare ma le premesse sono ottime.

Complessivamente, GPT-4o risulta essere 2 volte più veloce, costando la metà, rispetto a GPT-4 Turbo. Alcuni partner di Open AI potranno iniziare a utilizzare le API per l’implementazione del nuovo modello nel corso delle prossime settimane. Maggiori dettagli in tal senso arriveranno, di certo, a breve. Il nuovo GPT-40, in ogni caso, rappresenta una nuova possibile rivoluzione da parte dell’azienda.

Qui di seguito è possibile dare un’occhiata al video di “presentazione” del nuovo modello di Open AI. Da notare, inoltre, che sul canale YouTube di Open AI sono disponibili diversi video dimostrativi, appena pubblicati, per mostrare le capacità di GPT-4o.

ChatGPT arriva su macOS

A completare le novità della giornata di Open AI c’è il rilascio dell’app di ChatGPT, ora disponibile in versione desktop (e non soltanto mobile) ma solo per gli utenti macOS. Chi ha un computer Apple, quindi, potrà sfruttare il nuovo client desktop di ChatGPT, già disponibile, invece, su Android e iOS. In rampa di lancio, in ogni caso, c’è anche un’app Windows che arriverà, però, soltanto “nel corso dell’anno”. Su Windows 11, ricordiamo, c’è già Copilot a fornire l’accesso all’intelligenza artificiale agli utenti.