Gemini Live è una funzionalità che permette di interagire con il modello generativo di Google come se si stesse parlando con una persona in carne ed ossa. I più attenti in tema di Intelligenze Artificiali avranno già capito che si tratta di una soluzione molto simile alla modalità vocale avanzata che OpenAI ha implementato per il suo chatbot ChatGPT dopo il rilascio di GPT-4o.
Come funziona Gemini Live
Prima di proseguire è bene precisare che per ora questa feature è disponibile soltanto nel il mercato statunitense. A ciò si aggiunga che gli unici utenti autorizzati ad utilizzarlo sono, almeno per il momento, quelli che hanno sottoscritto l’abbonamento a Gemini Advanced.
Detto questo, Gemini Live è in pratica un assistente con il quale intrattenere delle conversazioni molto simili a quelle che si avrebbero con un interlocutore umano. Con la differenza che quest’ultimo è animato da un LLM (Large Language Model), può parlare di qualsiasi argomento (o quasi) ed è in grado di rispondere a qualunque domanda (o quasi). Purtroppo, la versione disponibile ad oggi supporta unicamente la lingua inglese.
Per utilizzare questa variante del servizio di Mountain View, non si deve far altro che scaricare Gemini dal Play Store ed installarlo. Fatto questo si noterà un piccolo pulsante presente sulla destra dell’interfaccia utente (“Go Live With Gemini“). Si potrà quindi iniziare ad interagire con la piattaforma e sono disponibili le opzioni “Stop” ed “End Live mode” per interrompere una conversazione.
Da notare che la piattaforma può funzionare anche in background e la cronologia delle sessioni permetterà di accedere alla loro trascrizione.
10 voci per l’AI di Google
Gli utilizzatori di Gemini Live hanno la possibilità di scegliere tra 10 voci differenti. Quelle del concorrente ChatGPT sono invece 12. Esse si differenziano tra loro per tipologia di timbro (alto, profondo, medio..) e tono di voce (brillante, energico, impegnato..).