back to top

Chrome: un OCR per leggere i PDF

Gli sviluppatori di Google Chrome hanno deciso di introdurre una nuova feature dedicata all’accessibilità nel browser Web più utilizzato al mondo. Tale funzionalità si basa sull’integrazione di un sistema di OCR (Optical Character Recognition) per la lettura dei file in formato PDF, aiutando ipovedenti e non vedenti nella fruizione di questo tipo di documenti.

L’implementazione di tale progetto partirebbe da una semplice considerazione: attualmente in Rete sarebbero presenti ben 360 miliardi di PDF i cui contenuti non possono essere consultati da chi soffre di problemi del campo visivo. Ciò capita ad esempio quando il documento è stato ottenuto effettuando la scansione di un testo in formato cartaceo.

Chrome potrebbe quindi trasformarsi in un vero e proprio "lettore" da richiamare quando il file da leggere non è accessibile per l’utente. Per questo scopo esistono già degli screen reader che però non possono interpretare le immagini, Google ha quindi voluto avvalersi di uno nuovo strumento basato sull’Intelligenza Artificiale.

Probabilmente, prima che questa funzionalità diventi disponibile dovrà passare ancora qualche mese, è necessario infatti che gli output prodotti dal browser siano il più precisi possibile. La fedeltà al testo è particolarmente importante, soprattutto quando i documenti elaborati fanno riferimento a ricerche scientifiche o ad altri approfondimenti dettagliati.

Questo nuovo strumento dovrebbe poi caratterizzarsi per un elevato livello di usabilità, per attivarlo sarebbe previsto infatti il solo comando: "Convert image to text". I primi utilizzatori a poter fruire della feature dovrebbero essere quelli che posseggono un terminale Chromebook equipaggiato con ChromeOS, successivamente il roll-out dovrebbe essere esteso a tutti.

Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Copilot Wave 2: piรน AI su Word ed Excel

La Casa di Redmond ha annunciato Wave 2, aggiornamento...

ChatGPT: o1 รจ l’erede di GPT

OpenAI ha presentato o1, modello generativo destinato all'integrazione su...

YouTube Music: Ask Music crea playlist con l’AI

YouTube Music ha lanciato una nuova funzionalitร , chiamata Ask...

AI: previsioni preoccupanti sulle emissioni di CO2

Qual รจ l'impatto sull'ambiente dell'Intelligenza Artificiale? Le AI richiedono...

Strawberry: ChatGPT pensa prima di parlare

Se tutto dovesse andare come previsto da Sam Altman...

Visual Intelligence, la Google Lens di Apple

Visual Intelligence รจ una nuova funzionalitร  sviluppata da Apple...
Pubblicitร