Scopri la potente IA Stable Diffusion XL Turbo: immagini in tempo reale mentre scrivi!

0

La settimana scorsa, Stability AI ha presentato Stable Diffusion XL Turbo, un nuovo e innovativo modello di sintesi d’immagine basato sull’intelligenza artificiale, in grado di generare rapidamente immagini a partire da un prompt scritto.

La straordinaria velocità di questo prodotto lo ha reso un elemento chiave per l’azienda, che lo ha definito come un sistema di generazione di immagini “in tempo reale”. La capacità di Stable Diffusion XL Turbo di trasformare rapidamente anche immagini provenienti da sorgenti come una webcam ha suscitato molto interesse nel pubblico.

La principale innovazione di SDXL Turbo risiede nella sua abilità di produrre output d’immagini in un singolo passaggio, riducendo significativamente il numero di passaggi richiesti dal suo predecessore, grazie alla tecnica denominata “Adversarial Diffusion Distillation” (ADD). Questa tecnica utilizza la distillazione dei punteggi, consentendo al modello di apprendere da modelli esistenti di sintesi d’immagini e di differenziare tra immagini reali e generate, migliorando il realismo dei risultati.

Stability ha approfondito il funzionamento del modello in un recente articolo di ricerca, concentrandosi sulla tecnica ADD. Uno dei principali vantaggi di SDXL Turbo è la sua somiglianza con le Generative Adversarial Networks (GAN), soprattutto nella capacità di produrre immagini in un solo passaggio.

Anche se le immagini generate da SDXL Turbo non raggiungono lo stesso dettaglio di quelle generate da SDXL a più passaggi, i risultati sono notevoli in termini di efficienza. Ad esempio, su un Nvidia RTX 3060, SDXL Turbo è in grado di generare un’immagine 1024×1024 in soli 3 step in circa 4 secondi, rispetto ai 26,4 secondi impiegati da SDXL per un’immagine a 20 step con dettagli simili.

Attualmente, SDXL Turbo è disponibile esclusivamente per uso non commerciale, una decisione che ha suscitato qualche critica nella community di Stable Diffusion.

La nuova IA Stable Diffusion XL Turbo genera immagini in tempo reale mentre scrivi

Stability AI ha presentato Stable Diffusion XL Turbo, un nuovo modello di sintesi d’immagine basato sull’intelligenza artificiale che può generare velocemente immagini da un prompt scritto. La velocità straordinaria di questo prodotto lo ha reso fondamentale per l’azienda, che lo ha definito un sistema di generazione d’immagini “in tempo reale”. La sua capacità di trasformare rapidamente immagini anche da fonti come una webcam ha suscitato grande interesse. La vera innovazione di SDXL Turbo risiede nella sua abilità di produrre output d’immagini in un singolo passaggio, grazie alla tecnica “Adversarial Diffusion Distillation” (ADD). Questa tecnica consente al modello di apprendere da modelli esistenti di sintesi d’immagini e di differenziare tra immagini reali e generate, migliorando il realismo dei risultati. Anche se le immagini prodotte da SDXL Turbo non hanno lo stesso dettaglio di quelle generate con più passaggi, sono comunque efficienti. Ad esempio, su una Nvidia RTX 3060, SDXL Turbo è in grado di generare un’immagine 1024×1024 in soli 3 step in circa 4 secondi, rispetto ai 26,4 secondi impiegati da SDXL per un’immagine a 20 step con dettagli simili. Attualmente, SDXL Turbo è disponibile solo per uso non commerciale.