Tra i progetti di OpenAI che hanno attirato maggiormente l’attenzione negli ultimi temi vi è sicuramente SORA, un modello generativo che permette di creare video tramite input testuali. Mountain View non poteva quindi rimanere indietro nel settore delle piattaforme text-to-video e nel corso della conferenza Google I/O ha annunciato la sua alternativa: Veo.
Stando alle demo presentate durante l’evento, questo servizio dovrebbe essere in grado di produrre clip filmate ad alta definizione, in formato 1080p, della durata superiore al minuto. A suo vantaggio vi sarebbe il fatto di presentarsi da subito come uno strumento adatto all’uso in ambito professionale, riesce infatti a comprendere diversi termini tipici degli ambienti cinematografici.
Veo è un modello generativo multimodale, questo significa che è in grado di elaborare diverse tipologie di contenuti. Per questo motivo i prompt formulari dagli utenti possono contenere testi, immagini statiche e persino dei video. Partendo da essi si potranno realizzare filmati di alta qualità come per esempio quelli proposti di seguito.
Google takes on OpenAI’s Sora with stunning new generative AI video model Veo
Since OpenAI unveiled its Sora generative AI video creation model earlier this year, nothing has come close in terms of sheer realism and quality of AI generated motion visuals — until now.
Amid the… pic.twitter.com/LVqBoPJ2DW
— EchoeWeb (@Echoeweb) May 15, 2024
Per la realizzazione di Veo sono stati coinvolti gli esperti AI dei laboratori di Google DeepMind. Demis Hassabis, CEO della sussidiaria di Alphabet, ha anticipato l’integrazione del modello in alcune piattaforma di Big G come per esempio YouTube dove potrebbe essere utilizzato nella creazione di Shorts. Chi volesse partecipare ai test può iscriversi all’apposita waitlist.
Durante la fase iniziale il training del modello dovrebbe coinvolgere protagonisti del settore audiovisivo come per esempio registi e videomaker. L’obbiettivo è quello di rendere Veo uno strumento ancora più completo in grado di supportare tutte le fasi di lavoro di un creativo, compresa la realizzazione di storyboard, producendo output sempre più lunghi.