back to top

L’AI di Microsoft trasformerà i suoni in immagini

Microsoft ha recentemente registrato un brevetto che potrebbe rivoluzionare il modo in cui le persone interagiscono con le presentazioni e le riunioni virtuali. Introducendo una tecnologia basata sull’AI che converte l’audio in immagini in tempo reale. Il documento, depositato il 5 aprile 2023 e pubblicato il 10 ottobre 2024 dall’Ufficio Brevetti e Marchi degli Stati Uniti (USPTO), descrive un sistema che utilizza un flusso audio per generare immagini in diretta. Offrendo un’ulteriore dimensione visiva alle comunicazioni verbali.

Con l’AI i suoni diventano immagini, in tempo reale

Il funzionamento di questo sistema prevede che durante una riunione o una lezione, l’audio venga trasformato in una trascrizione testuale grazie a un modello linguistico. Quest’ultimo riassume il contenuto e lo inserisce in un modello di generazione di immagini. Il risultato è un flusso continuo di immagini generate automaticamente che accompagnano la conversazione. Visualizzate in tempo reale sullo schermo.

Microsoft sostiene che l’integrazione di immagini generate dall’AI con la comunicazione verbale potrebbe rendere le interazioni più coinvolgenti ed efficaci. Un sistema di questo genere aiuterebbe a rendere i concetti più comprensibili e memorabili. Il tutto offrendo un supporto visivo che stimola l’attenzione degli utenti durante riunioni, presentazioni o lezioni.

Nuove funzionalità per Microsoft Copilot

La tecnologia descritta nel brevetto non è ancora disponibile sul mercato ma potrebbe essere integrata in future versioni di Teams, la piattaforma di videoconferenze dell’azienda, probabilmente tramite un’estensione dell’add-on AI Copilot, come Copilot Pro o Microsoft 365 Copilot. Quest’ultimo, già presente in alcuni strumenti di produttività, potrebbe quindi espandere le sue funzionalità includendo la capacità di generare immagini in tempo reale durante le riunioni, migliorando l’esperienza di collaborazione a distanza.

Come avviene per molti brevetti, non è però garantito che questa tecnologia sia destinata a vedere la luce a breve termine. La fase tra il deposito e la realizzazione di un prodotto è spesso lunga e molte idee non superano mai lo stadio progettuale.

Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Google Shopping personalizza gli acquisti con l’AI

Google ha introdotto una nuova versione di Google Shopping,...

Android 15 “Vanilla Ice Cream”. Tutte le novità

Il rilascio di Android 15 (Vanilla Ice Cream), inizialmente...

Microsoft Copilot non è un buon medico

Un recente studio condotto da ricercatori in Germania e...

Tesla Optimus non è ancora un robot autonomo

Durante l'evento di presentazione del Cybercab, i robot Tesla...

Adobe: AI per i video con Firefly Video Model

Adobe ha lanciato Firefly Video Model, la sua proposta...

Windows 11 24H2: una cache incancellabile da 8.63 GB

Dopo l'installazione del package Windows 11 24H2 è stato...
Pubblicità