back to top

Nova Sonic, il nuovo modello AI vocale di Amazon

Amazon ha annunciato il lancio di Nova Sonic, un modello di intelligenza artificiale generativa pensato per gestire nativamente gli input vocali e generare parlato naturale. Presentato nelle scorse ore, Nova Sonic rappresenta la risposta della compagnia ai progressi nei modelli di OpenAI e Google e dovrebbe distinguersi per velocità, qualità del riconoscimento vocale e naturalezza nella conversazione.

Come accedere a Nova Sonic

Disponibile tramite Amazon Bedrock, la piattaforma per sviluppatori dedicata all’AI aziendale, Nova Sonic è accessibile attraverso una nuova API di streaming bidirezionale. Secondo Amazon si tratta del modello vocale più economico sul mercato con un costo inferiore dell’80% rispetto a GPT-4o di OpenAI.

Pubblicità

Nova Sonic è già integrato in Alexa+, evoluzione dell’assistente vocale di Amazon. Stando a quanto dichiarato dai portavoce della casa madre, il nuovo modello eccelle nell’instradamento intelligente delle richieste verso API esterne, fonti di dati proprietarie o servizi online. Ha quindi una grande capacità di orchestrare sistemi complessi.

Durante le conversazioni Nova Sonic è in grado di riconoscere pause e interruzioni, aspettando il momento giusto per rispondere, e trascrive in tempo reale la voce dell’utente per applicazioni future. È poi meno soggetto a errori in fase di riconoscimento rispetto ad altri modelli vocali e riesce ad interpretare correttamente anche frasi dette in ambienti rumorosi o con una pronuncia imperfetta.

I risultati dei test sono incoraggianti

Secondo i test interni Nova Sonic ha raggiunto un tasso di errore medio del 4,2% su più lingue europee. Nella gestione di conversazioni complesse con più partecipanti è risultato il 46,7% più preciso rispetto al modello GPT-4o di OpenAI. In termini di velocità ha poi permesso di registrare una latenza percepita di 1,09 secondi ed è quindi più rapido del modello Sam Altman e soci (1,18 secondi).

Nova Sonic è parte della strategia di Amazon per costruire un’intelligenza artificiale generale (o AGI), capace di operare come un essere umano. Altri modelli multimodali (con supporto per immagini, video, sensori..) sarebbero già in fase di sviluppo.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

OpenAI: o3 e o4-mini “pensano con le immagini”

OpenAI ha confermato il lancio dei suoi due nuovi...

Grok Studio: alternativa gratuita a ChatGPT Canvas

xAI, società di Elon Musk, ha annunciato il lancio...

Meta utilizza i dati degli utenti per addestrare le sue AI

Meta ha reso noto l'avvio di una nuova fase...

DolphinGemma: l’AI di Google capisce la lingua dei delfini

In occasione della "Giornata Nazionale del Delfino" Google ha...

GPT-4.1: OpenAI rilascia il suo nuovo modello di AI

OpenAI ha annunciato il rilascio della nuova famiglia GPT-4.1,...

Nate: l’e-commerce AI era gestito da esseri umani?

Albert Saniger, il fondatore ed ex CEO della startup...
Pubblicità