Meta ha annunciato CM3Leon, un modello di intelligenza artificiale specializzato nella generazione di testo e immagini. CM3Leon sarà in grado di generare didascalie per le immagini, aprendo la strada a modelli di comprensione delle immagini più avanzati. A differenza di altri generatori di immagini, CM3Leon utilizza un modello trasformer più efficiente, che richiede cinque volte meno potenza di calcolo. Per addestrare CM3Leon, Meta ha utilizzato un dataset di milioni di immagini con licenza Shutterstock, e la versione più avanzata del modello si basa su più di 7 miliardi di parametri, il doppio di DALL-E 2. Meta ha utilizzato una tecnica d’addestramento chiamata fine-tuning supervisionato, che ha permesso di migliorare le prestazioni di CM3Leon nella generazione di immagini e nella scrittura di didascalie. Il modello è in grado di generare immagini anche a partire da prompt molto specifici. Non sono ancora stati forniti dettagli sul rilascio pubblico di CM3Leon, ma Meta sta lavorando su altri modelli nel campo dell’intelligenza artificiale, come MusicGen, un modello che genera musica a partire da una richiesta testuale.
il nuovo generatore di immagini IA promette grandi risultati
L’azienda Meta ha annunciato CM3Leon, un modello di intelligenza artificiale specializzato nella generazione di testo e immagini. Questo modello sarà in grado di generare didascalie per le immagini, aprendo la strada a modelli di comprensione delle immagini più avanzati. A differenza dei generatori di immagini tradizionali, CM3Leon si basa su un modello trasformer più efficiente, richiedendo meno potenza di calcolo. Meta ha utilizzato un dataset di milioni di immagini per addestrare CM3Leon, con risultati promettenti. Non sono state fornite informazioni sul rilascio pubblico di CM3Leon, ma Meta sta lavorando ad altri modelli di intelligenza artificiale, dimostrando un grande interesse in questo campo.