Il modello generativo Imagen 2 permetterà agli utenti di Google Bard di creare immagini a partire da descrizioni testuali. Tale novità renderà la soluzione di Mountain View ancora più multimodale, cioè in grado di elaborare diverse tipologie di contenuti, nonché più competitiva rispetto a piattaforme come Stable Diffusion, Midjourney e DALL·E.
Questa novità non è stata ancora presentata ufficialmente ma alcune anticipazioni a riguardo sono circolate nelle scorse ore su X. Grazie ad esse scopriamo che Imagen 2 sfrutterà la propria tecnologia a diffusione per generare immagini sulla base dei prompt degli utenti e sarà disponibile un’opzione per creare ulteriori immagini tra cui scegliere.
In fase iniziale la piattaforma dovrebbe poter elaborare soltanto richieste formulate in lingua Inglese (alternative come DALL·E di OpenAI e Bing Image Creator supportano già da tempo l’Italiano). Successivamente il servizio verrà esteso ad altri mercati ma sarà siicuramente necessario un ulteriore addestramento del modello sottostante.
Back to the future? ??
Here's what's coming next in Bard. . . tomorrow.
Image generation with Bard will use Imagen, Google's Text-to-Image "diffusion technology."https://t.co/FNeiCsS2ar
Important: The content of this changelog may still be changed until officially released. pic.twitter.com/9yRNjHNrLq
— Dylan Roussel (@evowizz) January 17, 2024
Nel changelog diffuso sul social network di Elon Musk si parla chiaramente di un aggiornamento per il Text-to-Image ancora in fase sperimentale. Imagen 2 è comunque già disponibile per alcune tipologie di utenti, come per esempio quelli che utilizzano l’infrastruttura di Google Cloud dove è presente la piattaforma di Machine Learning Vertex AI.
è abbstanza probabile che nel prossimo futuro questa funzionalità sia disponibile anche per gli utenti standard tramite smartphone. Da tempo si parla infatti di un’applicazione per Bard, quest’ultima inoltre potrebbe sostituire completamente l’Assistente Google invece di diventare parte di esso e concorrere quindi con quella di ChatGPT.