L’intelligenza artificiale continua a evolversi e la sua applicazione nei modelli linguistici sta diventando sempre più sofisticata. Al recente evento dedicato agli sviluppatori Google I/O 2023 il gigante della tecnologia ha svelato il suo ultimo gioiello, PaLM 2, un potente modello linguistico che promette di rivoluzionare il settore. Scopriamo insieme tutti i dettagli di questa innovazione e come si confronta con i suoi concorrenti, come GPT-4 di OpenAI.

PaLM 2 estende le funzionalità dei prodotti di Google

Mercoledì scorso, durante l’atteso evento annuale Google I/O che si è tenuto presso Mountain View, California, il colosso tecnologico ha svelato con grande entusiasmo il lancio di PaLM 2, una nuova e rivoluzionaria generazione di modelli linguistici fondamentali in grado di competere con GPT-4 di OpenAI, attualmente uno dei più avanzati sul mercato.

Questo potente strumento, frutto di anni di ricerca e sviluppo da parte del team di esperti di Google, viene già impiegato in ben 25 prodotti dell’azienda, tra cui spicca l’assistente conversazionale Google Bard, il quale promette di migliorare significativamente l’interazione tra gli utenti e la tecnologia grazie alla sua capacità di comprendere e rispondere in modo naturale alle domande e ai comandi. Se interessati, potete leggere più informazioni sulle novità di Google Bard in questo articolo dedicato.

La presentazione di PaLM 2 ha suscitato un grande interesse tra gli addetti ai lavori e il pubblico, in quanto rappresenta un ulteriore passo avanti nel campo dell’intelligenza artificiale e dei modelli linguistici. Grazie a un processo di apprendimento profondo basato su reti neurali e all’utilizzo di una vasta gamma di dati provenienti da diverse fonti, PaLM 2 è in grado di padroneggiare un’ampia varietà di compiti e funzioni, migliorando così l’efficacia e l’efficienza di numerose applicazioni software di Google.

Tra i prodotti che beneficiano delle innovazioni apportate da PaLM 2, oltre all’assistente conversazionale Bard, vi sono anche le celebri applicazioni per la produttività come Google Docs, Sheets e Slides, le quali grazie all’integrazione con questo avanzato modello linguistico offrono agli utenti nuove funzionalità basate sull’intelligenza artificiale, come suggerimenti di scrittura, traduzioni automatiche più accurate e analisi dei dati in tempo reale. Anche in questo caso, qualora vogliate approfondire vi consigliamo di leggere il nostro articolo dedicato.

Cos’è PaLM 2 e come funziona

PaLM 2 (Pathways Language Model) è una famiglia di modelli linguistici di grandi dimensioni addestrati su enormi quantità di dati in grado di prevedere la parola successiva dopo un input umano. “Pathways” è una tecnica di apprendimento automatico creata da Google, e PaLM 2 arriva dopo l’originale PaLM, introdotto nell’aprile 2022.

Durante l’evento, il CEO di Google Sundar Pichai ha presentato le quattro dimensioni di PaLM 2: Gecko, Otter, Bison e Unicorn. Il primo che abbiamo elencato, Gecko, è il modello più piccolo ed è progettato per essere eseguito su dispositivi mobili e, insieme a Bard, è alla base delle funzioni AI di Docs, Sheets e Slides di cui abbiamo parlato poco sopra.

Secondo quanto riferito da Google, PaLM 2 supporta oltre 100 lingue ed è capace di ragionare, generare codice e tradurre in più lingue. Nelle galleria presente qui sotto potete osservare le risposte dell’assistente di Google in alcuni contesti che abbiamo menzionato.

PaLM 2 è pronta a sfidare GPT-4

L’obiettivo di Google è ormai chiaro: sfidare OpenAI e, possibilmente, affermarsi come leader anche in questo settore. A tal proposito sono stati condotti alcuni test tra i due prodotti che evidenziano come ci siano differenze fondamentali che, nel corso del tempo, fungeranno da ago della bilancia nella scelta di uno o dell’altro servizio.

Sebbene i benchmark tecnici forniti da Google suggeriscano che PaLM 2 sia in grado di superare GPT-4 in una serie di compiti specifici come la risoluzione di problemi matematici, la traduzione tra diverse lingue e il ragionamento logico, le valutazioni indipendenti condotte da esperti e ricercatori esterni all’azienda rivelano risultati più sfumati e talvolta discordanti. In particolare, alcune analisi comparative tra PaLM 2 e GPT-4 mostrano che, mentre il modello di Google eccelle in determinate categorie di compiti, in altre sfere GPT-4 mantiene un leggero vantaggio. Ad esempio, nei test di comprensione del linguaggio naturale e nella generazione di testo coerente e contestualmente appropriato, GPT-4 sembra conservare un margine di superiorità rispetto a PaLM 2.

Queste differenze di prestazioni possono essere attribuite a vari fattori, tra cui le differenti architetture dei modelli, gli algoritmi di apprendimento utilizzati e i dataset di addestramento impiegati durante lo sviluppo dei due sistemi. Inoltre, va considerato che i benchmark forniti dalle aziende spesso mettono in luce gli aspetti in cui il loro prodotto eccelle, mentre tendono a minimizzare o tralasciare le aree in cui potrebbe essere meno performante.

Fino a marzo la famiglia di modelli linguistici PaLM era utilizzata solo internamente da Google Research, tuttavia l’azienda ha iniziato a offrire un accesso limitato alle API del primo PaLM, caratterizzato da ben 540 miliardi di parametri. Questi numeri rappresentano la “conoscenza” appresa dal modello, consentendo predizioni e generazione di testo basate sugli input ricevuti. Per confronto, GPT-3 di OpenAI (dal 2020) conta 175 miliardi di parametri, mentre il numero di parametri di GPT-4 non è stato rivelato. Google, tuttavia, non ha fornito informazioni sul numero di parametri di PaLM 2, il che ha generato un po’ di malcontento tra gli esperti del settore che chiedono maggiore trasparenza sui meccanismi dei modelli di intelligenza artificiale.

Fonti di dati e questioni etiche di PaLM 2

Google sostiene che PaLM 2 sia stato addestrato su un vasto e diversificato insieme di fonti, tra cui documenti web, libri, codici, matematica e dati di conversazione. Tuttavia, l’azienda non fornisce dettagli precisi sulle origini di questi dati.

Come altri grandi dataset di modelli linguistici, il dataset di PaLM 2 potrebbe includere materiale protetto da copyright utilizzato senza autorizzazione e contenuti potenzialmente dannosi raccolti dal web. I dati di addestramento sono fondamentali per determinare il comportamento di qualsiasi modello di intelligenza artificiale, pertanto alcuni esperti sollecitano l’adozione di set di dati aperti che garantiscano riproducibilità scientifica e controllo etico.

Nonostante le critiche sulla mancanza di trasparenza, Google prosegue nel suo impegno a diffondere i modelli di IA. Durante il Google I/O l’azienda ha mostrato le funzionalità dell’intelligenza artificiale in molti dei suoi prodotti principali, annunciando che un’ampia fetta di pubblico potrà presto interagire con esse. Tuttavia, è importante tenere presente che tutti i modelli linguistici di grandi dimensioni, come PaLM 2, possono generare informazioni fuorvianti o del tutto irrealistiche; di conseguenza, è importante verificare il contenuto di ogni singola risposta e valutare con attenzione la veridicità dei contenuti.

Piani futuri e disponibilità di Google Bard

PaLM 2 non rappresenta il punto d’arrivo nella ricerca di Google nel campo dell’intelligenza artificiale, bensì solo un punto di inizio. Durante la presentazione all’I/O, Pichai ha accennato a un nuovo modello multimodale chiamato “Gemini“, attualmente in fase di addestramento, di cui al momento non si hanno molti dettagli.

Nel frattempo che vengano condivide maggiori informazioni su questo nuovo modello, gli utenti di Google negli Stati Uniti e in altri 180 Paesi (ad eccezione del Canada e dell’Europa continentale) possono sperimentare PaLM 2 attraverso Google Bard, l’assistente AI sperimentale. Si spera che il chatbot di Google possa fare il suo approdo anche nel nostro paese nel corso delle prossime settimane.

Potrebbe interessarti anche: GPT-5 sarebbe più lontano del previsto, parola del CEO di OpenAI