back to top

Google: l’AI di Genie 2 crea mondi virtuali

Google DeepMind ha presentato Genie 2, un modello d’intelligenza artificiale di larga scala progettato per generare ambienti virtuali interattivi e controllabili. L’obbiettivo di questo progetto è quello di sviluppare un’AI in grado di comprendere e replicare le dinamiche complesse del nostro ambiente.

Le caratteristiche principali di Genie 2

Genie 2 è stato addestrato in modo non supervisionato utilizzando un’ampia selezione di video non etichettati provenienti da Internet. Questa metodologia consente al modello di generare una varietà infinita di mondi virtuali descritti attraverso testo, immagini sintetiche, fotografie e persino dei semplici schizzi.

Pubblicità
Genie 2: Google's New AI Model Turns One Image into Infinite Playable Worlds

Il modello permette inoltre di interagire con gli ambienti generati. Agisce infatti su una base frame-by-frame, senza la necessità di etichette predefinite per le azioni che si devono compiere.

È composto da tre elementi principali:

  1. la tokenizzatore video spaziotemporale che segmenta i filmati in unità comprensibili per il modello.
  2. un modello dinamico autoregressivo che prevede le sequenze future basandosi sui dati precedenti.
  3. un modello d’azione latente scalabile che facilita l’interazione dell’utente con l’ambiente generato.

Questa architettura consente a Genie 2 di apprendere le dinamiche del mondo reale e di applicarle nella generazione di ambienti virtuali. L’ideale per offrire un’esperienza interattiva e immersiva.

Agenti AI che si muovono in mondi virtuali

Genie 2 ha la capacità di facilitare l’addestramento di agenti AI per imitare comportamenti osservati in video non visti durante l’addestramento. Si possono così implementare degli agenti generalisti in grado di operare in una varietà di ambienti e situazioni analizzate in fase di post-training.

La capacità di creare ambienti interattivi e controllabili, basandosi su dati non supervisionati, offre nuove opportunità per lo sviluppo di agenti AI adattabili. Google DeepMind punta quindi a costruire sistemi di intelligenza artificiale più generali a partire dall’esperienza di Gemini, dei veri e propri modelli generativi di mondi.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Google testa l’AI Mode nelle ricerche

Google ha deciso di potenziale il suo motore di...

L’AI diventa una stilista su Google Shopping

Google ha annunciato alcune nuove funzionalità per lo shopping...

Internet alla velocità della luce con il chip Taara di Google

Il team di Taara, parte della "moonshot factory" di...

Google porta la visualizzazione edge-to-edge su Chrome

Google ha annunciato che, a partire dalla versione 135,...

Google sta testando le AI Overviews in Italia

Secondo alcune segnalazioni raccolte da Barry Schwartz sul popolare...

Gemini crea grafici dai dati

Google ha annunciato un importante aggiornamento per Fogli che...
Pubblicità