Dopo i modelli vocali e testuali annunciati nei mesi scorsi, Microsoft compie un nuovo passo decisivo nel suo percorso verso l’autonomia nell’intelligenza artificiale: il colosso di Redmond ha infatti presentato a metà ottobre MAI-Image-1, il suo primo modello di generazione di immagini sviluppato internamente in casa che ora è stato reso disponibile per (quasi) tutti gli utenti. Un lancio tutt’altro che simbolico, che segna un cambio di strategia profondo per l’azienda guidata da Satya Nadella, pronta a ridurre la propria dipendenza da partner esterni (come OpenAI) e a costruire un ecosistema di modelli completamente proprietario.

Offerta

Apple MacBook Air 13'', M4 (2025)

849€ invece di 1149€
-26%

MAI-Image-1 di Microsoft debutta su Bing

MAI-Image-1 non è solo un nuovo strumento creativo, ma rappresenta il terzo tassello della famiglia di modelli interni di Microsoft, dopo MAI-Voice-1 dedicato alla sintesi vocale e MAI-1-Preview, un chatbot sperimentale. Con questo debutto l’azienda punta a competere ad armi pari con i modelli di OpenAI e Google, posizionandosi come uno dei pochi attori in grado di sviluppare modelli multimodali di alto livello proprietari.

Il nuovo strumento è frutto di anni di ricerca e addestramento, durante i quali l’azienda si è concentrata su due aspetti fondamentali: evitare risultati ripetitivi o eccessivamente stilizzati (problema comune tra i generatori di immagini) e garantire una maggiore fedeltà visiva, in particolare nella resa di illuminazioni complesse, riflessi e texture.

Il risultato è un modello capace di eccellere nella riproduzione di scene naturalistiche, fotografie di cibo e paesaggi fotorealistici, ma anche nella generazione di immagini artistiche e composizioni creative; inoltre, MAI-Image-1 risulta significativamente più veloce rispetto ad altri modelli di grandi dimensioni oggi sul mercato, un fattore determinante per chi lavora in ambito creativo e ha bisogno di iterare rapidamente su molteplici versioni di un’idea.

mai-image-1 microsoft bing

A partire da oggi, MAI-Image-1 è disponibile su Bing.com/create e nelle app mobili di Bing, con un semplice selettore che consente agli utenti di scegliere esplicitamente il nuovo modello. L’integrazione con Copilot e Bing Image Creator è già attiva, mentre il rilascio per gli utenti dell’Unione Europea è previsto a breve, una tempistica che probabilmente tiene conto delle normative europee in materia di IA e tutela dei dati.

In pratica, chiunque potrà accedere al modello selezionato nel menù dedicato e generare immagini in pochi secondi, sfruttando le nuove capacità fotorealistiche e la resa più accurata delle luci sulle superfici.

Nonostante sia un progetto appena lanciato, MAI-Image-1 è già entrato nella top 10 di LMArena, la piattaforma che mette a confronto i principali modelli di generazione di immagini attraverso valutazioni degli utenti reali; un traguardo significativo per un modello ancora giovane, che dimostra la solidità dell’approccio interno di Microsoft e il suo potenziale competitivo nei confronti di laboratori ormai affermati.

Lo stesso Mustafa Suleyman, CEO di Microsoft AI (ed ex co-fondatore di DeepMind) ha presentato con entusiasmo il modello su X (ex Twitter), invitando gli utenti a provarlo e a condividere le proprie creazioni. Tra gli esempi mostrati spiccano composizioni con illuminazione artistica, dettagli realistici e ambienti naturali, con una resa che ricorda da vicino quella delle fotografie professionali.

Con MAI-Image-1 Microsoft non si limita a seguire la corsa all’intelligenza artificiale generativa, ma dichiara apertamente di voler costruire uno stack tecnologico completo e indipendente, controllato in ogni sua parte: dal testo (con Copilot e MAI-1-Preview), alla voce (con MAI-Voice-1), fino alle immagini.

È una mossa che arriva in un momento di forte trasformazione del mercato, dove Google e OpenAI si contendono la leadership della generazione multimodale e Apple, da parte sua, si prepara a entrare nel settore con i suoi modelli proprietari. Microsoft invece sembra puntare su un equilibrio diverso, partnership strategiche, ma autonomia tecnica; una filosofia che le consente di mantenere l’accesso ai modelli di frontiera di OpenAI, pur sviluppando soluzioni proprietarie per i propri prodotti e clienti.

La disponibilità di MAI-Image-1 segna dunque una tappa chiave nella corsa verso l’autosufficienza dell’intelligenza artificiale, per la prima volta Microsoft non si limita a integrare modelli terzi, ma diventa protagonista diretta nella creazione di sistemi generativi di livello mondiale, con un’attenzione quasi artigianale al dettaglio visivo, alla velocità di risposta e all’esperienza d’uso.