Microsoft ha un nuovo generatore di immagini fotorealistiche

Microsoft generatore immagini
Crediti: Microsoft

Microsoft entra con decisione nell’arena dei generatori di immagini text-to-image con l’annuncio del suo primo modello proprietario: MAI-Image-1.

Sviluppata interamente nei laboratori di Microsoft AI, questa nuova tecnologia rappresenta una pietra miliare per l’azienda, che la definisce “il prossimo passo nel nostro viaggio” verso la creazione di un ecosistema di intelligenza artificiale completo e autonomo.

Le foto generate da MAI-Image-1 sono già un successo

L’annuncio segue di poco la presentazione dei primi modelli di IA generativa sviluppati in-house, confermando la volontà del gigante tecnologico di ridurre la sua dipendenza da partner esterni, inclusa OpenAI.

Il punto di forza dichiarato di MAI-Image-1 è la sua eccezionale capacità di generare immagini fotorealistiche. Secondo quanto comunicato dall’azienda, il modello “eccelle” nella creazione di scene complesse e ricche di dettagli, come paesaggi naturali, fenomeni atmosferici come fulmini e altre composizioni che richiedono un alto grado di realismo.

Per raggiungere questo livello qualitativo, Microsoft ha rivelato di aver collaborato attivamente con professionisti del settore creativo, raccogliendo feedback mirati a evitare la produzione di “risultati ripetitivi o dallo stile generico”, una critica spesso mossa ad altri generatori di immagini.

Un altro vantaggio competitivo su cui Microsoft punta è la velocità. MAI-Image-1 sarebbe in grado di elaborare le richieste testuali (prompt) e produrre le immagini corrispondenti in tempi significativamente più rapidi rispetto a “modelli più grandi e lenti” attualmente sul mercato.

Questa efficienza potrebbe rivelarsi un fattore decisivo sia per l’esperienza utente che per l’integrazione su larga scala nei suoi prodotti software.

Le affermazioni dell’azienda trovano già una prima conferma esterna: il modello si è assicurato un posto nella top 10 di LMArena, una nota piattaforma di benchmark dove gli esseri umani confrontano e votano anonimamente i risultati prodotti da diversi sistemi di intelligenza artificiale.

La strategia IA di Microsoft

Questo lancio non è un evento isolato, ma si inserisce in una strategia più ampia di diversificazione e potenziamento delle proprie capacità interne nel campo dell’IA.

MAI-Image-1 si affianca infatti ad altri prodotti della stessa famiglia, come il generatore vocale MAI-Voice-1 AI e il chatbot MAI-1-preview.

Sebbene Microsoft sia stata uno dei primi e più importanti finanziatori di OpenAI, la relazione tra le due aziende è diventata nel tempo più complessa e competitiva.

La scelta di Microsoft di utilizzare recentemente anche i modelli di Anthropic per alcune funzionalità di Microsoft 365 e di effettuare “investimenti significativi” nella formazione dei propri modelli è un chiaro segnale di questa evoluzione strategica.

L’azienda americana ha dichiarato il suo impegno a “garantire risultati sicuri e responsabili“, ma al momento non sono disponibili test indipendenti sulle misure di sicurezza e sui “guardrail” implementati per prevenire la generazione di contenuti dannosi o inappropriati.

Sarà fondamentale osservare quali politiche verranno adottate una volta che lo strumento sarà accessibile a un pubblico più vasto.