Da sempre conosciamo le differenze tra lingua "scritta" e lingua "parlata", due versioni del medesimo idioma che presentano delle peculiaritร sia dal punto di vista stilistico che da quello sintattico. รจ forse meno noto il fatto che esistono delle lingue unicamente "parlate", delle quali non รจ presente una versione scritta a cui fare riferimento.
Questa particolaritร ha unโimportanza fondamentale nello sviluppo delle tecnologie per la traduzione automatica, ciรฒ avviene perchรฉ i modelli sviluppati fino ad ora sono stati incentrati principalmente sullโacquisizione di documenti e sul miglioramento della comprensione del linguaggio naturale tramite un confronto tra lingua scritta e parlato.
Ciรฒ ha portato ad una sostanziale marginalizzazione delle lingue che vengono "solo parlate", si pensi per esempio agli idiomi utilizzati da diverse popolazioni indigene sparse in tutto il mondo, per tale motivo i ricercatori di Meta hanno deciso di trovare una soluzione sviluppando Intelligenze Artificiali in grado di tradurre anche queste ultime.
Attualmente infatti esistono circa 7 mila lingue e il 40% di esse non sarebbero associate ad un sistema di scrittura adottato universalmente. Tradurle diventa spesso difficile per via della scarsitร di dati prodotti in quelle lingue, per questa ragione Meta ha deciso di utilizzare un nuovo sistema di apprendimento automatico basato sulle lingue "intermedie".
Risultati di buon livello in questo campo sarebbero stati raggiunti ad esempio nella traduzione dallโInglese allโHokkien, unโinsieme di dialetti parlati da Cinesi residenti in zone del Sud-est asiatico e a Taiwan, per la quale come lingua intermedia รจ stato utilizzato il Cinese Madarino che ha permesso di integrare il modello con dati non disponibili tramite lโHokkien.