back to top

Google Lens: Video Search e ricerche vocali

Mountain View ha implementato una nuova funzionalitร  in Google Lens che permette di utilizzare i video per le ricerche. Ora, oltre a scattare foto, รจ possibile registrare un video e si possono anche inviare input vocali su ciรฒ che si trova intorno a noi.

Questa novitร , basata sul modello AI Gemini, analizza i fotogrammi di un video per fornire risposte pertinenti, utilizzando tecniche di visione artificiale. Chi visita un luogo specifico puรฒ porre delle domande alla piattaforma mentre riprende la scena con il proprio smartphone.

AI Overview per Google Lens

Lโ€™innovazione รจ stata presentata nel corso del Google I/O 2024 e rappresenta unโ€™evoluzione delle capacitร  di Google Lens fino ad ora focalizzata sulle immagini statiche. Grazie ad essa si puรฒ ottenere una AI Overview basata sia sul contenuto di un video che su domande vocali.

Per ora questa funzionalitร  non รจ in grado di riconoscere i suoni allโ€™interno dei video ma Big G sta giร  sperimentando questa possibilitร  per il futuro.

Oltre alla funzione video, Google ha introdotto un aggiornamento per la ricerca tramite foto. In precedenza infatti, gli utenti potevano digitare una domanda solo dopo aver scattato una foto. Ora รจ possibile utilizzare direttamente la propria voce mentre si inquadra un soggetto. Per far questo basta tenere premuto il pulsante di scatto e porre la domanda.

Il supporto vocale รจ in fase di rilascio globale sia per Android che per iOS sebbene ad oggi sia disponibile solo in lingua inglese.

Lโ€™evoluzione di Gemini

Come confermato da Rajan Patel, responsabile della divisione engineering presso la compagnia californiana, la versione โ€œtradizionaleโ€ di Google Lens catturava i video come una serie di frame su cui veniva applicata la medesima tecnica di analisi visiva. Ora invece, grazie ad una variante di Gemini appositamente addestrata, il sistema รจ in grado di analizzare piรน frame in sequenza operando un riconoscimento molto preciso.

Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

I Google Pixel funzionano anche senza batteria

Google ha rilasciato di recente una nuova funzionalitร  che...

Google: lโ€™AI di Genie 2 crea mondi virtuali

Google DeepMind ha presentato Genie 2, un modello d'intelligenza...

Google lancia Gemini 2.0, lโ€™AI che opera tramite Agenti

Google ha ufficializzato il lancio di Gemini 2.0, il...

Android: app bancarie limitate nelle versioni piรน datate

Google ha annunciato alcuni miglioramenti all'API Play Integrity mirati...

GenCast: lโ€™AI di Google per le previsioni meteo

DeepMind, la divisione di intelligenza artificiale di Google, ha...

Google: le ricerche degli Italiani nel 2024

Il 2024 รจ stato un anno ricco di eventi,...
Pubblicitร