A seconda della tipologia di attivitร che si desidera svolgere online รจ possibile che un sito Web abbia la necessitร di proporre i propri contenuti in mercati diversi dove si parlano lingue differenti. Una piattaforma di e-commerce creata in Italia, ad esempio, potrebbe vendere i propri prodotti anche allโestero, nello stesso modo unโazienda che offre servizi di consulenza finanziaria potrebbe rivolgersi ad una platea di utenti piรน ampia di quella presente nel proprio Paese.
Per affrontare queste particolari esigenze la sola traduzione delle pagine in unโaltra lingua, o in piรน lingue, potrebbe non essere sufficiente, soprattutto in considerazione delle implicazioni che ciรฒ potrebbe avere per la SEO (Search Engine Optimization). A tal proposito รจ utile introdurre una prima basilare distinzione tra sito Web multilingua e sito Web multiregionale.
Indice
Differenze tra siti Web multilingua e siti Web multiregionali
Un sito Web multilingua ha la caratteristica di mettere a disposizione i propri contenuti, proporre i propri servizi/prodotti in lingue differenti. Il titolare del sito Internet di un albergo situato a Stintino in Sardegna, ad esempio, potrebbe effettuare una traduzione delle proprie pagine in inglese, tedesco e francese perchรฉ desidera moltiplicare le proprie occasioni di contatto con clienti stranieri potenzialmente interessati ad una vacanza in Italia.
Un sito Web multiregionale รจ invece un sito che si rivolge nello specifico a mercati esteri adattando i propri contenuti alle specificitร di altri paesi. Unโagenzia che si occupa del disbrigo di pratiche per lโimmigrazione, ad esempio, deve confrontarsi con le legislazioni dei vari stati e per questo motivo sviluppare contenuti e servizi adatti a Paesi differenti nelle lingue corrispondenti. Non si tratterร , quindi, di semplici traduzioni di contenuto ma di contenuti, in parte, differenti.
Eโ appena il caso di sottolineare che un sito potrebbe essere sia multilingua che multiregionale, tuttavia la distinzione proposta รจ tuttโaltro che teorica ed ha risvolti pratici in ottica SEO in quanto:
- nel caso dei siti Web multilingua Google cercherร di mostrare tra le pagine che corrispondano alla lingua di chi ha effettuato la ricerca;
- nel caso dei siti Web multiregionali Google farร riferimento alle impostazioni internazionali delle pagine e cercherร di restituire quelle piรน adatte alla regione da cui รจ stata formulata la query (la discriminante, quindi, non รจ puramente linguistica ma territoriale).
Come Google vede le pagine multilingua
Elementi non idonei alla determinazione linguistica/territoriale di una pagina web
Diversamente da quello che si potrebbe pensare, certe caratteristiche strutturali delle pagine web non sarebbero sufficienti ad una corretta interpretazione da parte degli spider di Google. Vediamoli nel dettaglio.
Lโutilizzo dellโattributo lang nel tag html, ad esempio:
<html lang="en">
fornisce un identificatore linguistico al browser ma non viene preso in considerazione dal motore di ricerca per questo scopo, nel senso che Google non ritiene questa indicazione sufficiente per la catalogazione della pagina come lingua inglese!
Stesso discorso per quanto riguarda lโURL delle pagine, quindi una pagina associata allโindirizzo:
https://www.mio-sito.it/en/
non viene automaticamente considerata come una pagina scritta in Inglese da parte di Google. Anche lโutilizzo di nomi a dominio con estensione geografica ben precisa non offre certezze a Google dal punto di vista della lingua impiegata nel testo, ma torneremo a breve su questo argomento.
Nello stesso modo, e questo vale anche per i siti multiregionali, non vengono presi in considerazione alcuni meta tag come geo.region, geo.placename o geo.position, nonostante essi abbiano lo scopo di specificare la localitร in cui viene svolta una determinata attivitร .
Il ruolo dei nomi a dominio nella determinazione del targeting geografico
Come anticipato, i suffissi dei nomi a dominio non hanno un ruolo fondamentale nellโidentificazione dei siti Web multilingua. Possono avere perรฒ unโimportanza per quanto riguarda i siti Web multiregionali, a patto di tenere presente alcuni criteri che regolano il comportamento del crawler di Google deputati alla scansione delle pagine.
Quando si parla di nomi a dominio e targeting geografico dei siti Web ci si riferisce in particolare ai ccTLD (Country Code Top Level Domain), anche detti domini di primo livello nazionale, come per esempio .it per lโItalia o .es per la Spagna. Lโutilizzo di questi suffissi, tuttavia, seppur abbia una connotazione geografica ben precisa, non รจ considerato garanzia circa il targeting del contenuto.
Eโ bene ricordare, inoltre, che esistono anche dei ccTLD, detti vanity ccTLD, in cui le estensioni potrebbero essere interpretate come delle indicazioni generiche (si pensi infatti a suffissi come .io, riferito al territorio britannico dellโOceano Indiano, .bz, assegnato allo stato del Belize, .tv, Isole Tuvalu, e .me del Montenegro, tutti utilizzati frequentemente per scopi differenti dal targeting geografico).
Anche il suffisso del dominio, quindi, come detto in precedenza, non รจ considerato da Google un elemento discriminante sufficientemente certo alla determinazione del targeting geografico di un sito web ma, ad eccezione dei vanity ccTLD, puรฒ essere comunque considerato un โindizioโ dellโambito territoriale cui si rivolge un sito web.
SEO e targeting geografico delle pagine web
Per ovviare a tali ambiguitร Google permette di comunicare lโesistenza di versioni localizzate di una pagina web (o di una risorsa on-line) utilizzando tre differenti modalitร : il codice HTML, le intestazioni HTTP e la sitemap.
Utilizzare lโattributo hreflang
Una prima modalitร per informare Google riguardo allโesistenza della versione localizzata di una pagina รจ quella di sfruttare lโattributo hreflang del tag link, passando ad esso il codice della lingua utilizzata per i contenuti ed il link della relativa risorsa. Lโattributo in questione funziona in modo non dissimile dallโattributo canonical.
I tag link con attributo hreflang devono essere inseriti nelle intestazioni (<head>..</head>) delle pagine Web, uno per ciascuna localizzazione.
Vediamo un esempio. Supponiamo che il nostro ipotetico Hotel di Stintino abbia realizzato il suo sito web in quattro lingue: italiano, inglese, tedesco e francese. Per comunicare a Google le varie versioni linguistiche delle diverse pagine del sito lo sviluppatore ha correttamente integrato il tag hreflang in ciascuna pagina per elencarne le varie versioni. Nella pagina in italiano dedicata alle stanze, quindi, avremo lโinclusione di questo codice:
<link rel="alternate" hreflang="en" href="https://www.albergo-esempio.it/en/rooms.html" />
<link rel="alternate" hreflang="de" href="https://www.albergo-esempio.it/de/raume.html" />
<link rel="alternate" hreflang="fr" href="https://www.albergo-esempio.it/fr/pieces.html" />
Eโ bene evitare lโinclusione di link auto-referenziali cioรจ, per esempio, nella pagina in italiano dovranno essere inseriti i link alle speculari pagine nelle altre lingue ma non anche il link alla stessa pagina italiana!
Eโ bene precisare che oltre alla lingua รจ anche possibile specificare la sua declinazione, ad esempio: volendo comunicare la localizzazione di due pagine, una in Francese ma per il mercato belga e una seconda nella stessa lingua ma per il Canada, si potrebbero utilizzare le sintassi seguenti:
<link rel="alternate" hreflang="fr-be" href="https://www.albergo-esempio.it/fr-be/pieces.html" />
<link rel="alternate" hreflang="fr-ca" href="https://www.albergo-esempio.it/fr-ca/pieces.html" />
La Search Console di Google offre lo strumento Rapporto Targeting internazionale che consente di comunicare direttamente al motore di ricerca il targeting geografico di un sito Web, per far questo รจ comunque necessario che le intestazioni HTML presentino lโattributo hreflang.
Targeting geografico e intestazioni HTTP
Dato che nel caso delle pagine Web รจ disponibile la modalitร basata sullโutilizzo del tag <link>, nettamente piรน semplice da implementare, le intestazioni HTTP rappresentano una buona soluzione nel caso di altri formati di file come, per esempio, i documenti in PDF. Per consentire il targeting geografico esse devono contenere almeno due informazioni:
- lโURL della pagina da localizzare;
- il codice della lingua utilizzata per i contenuti della pagina.
Il codice seguente mostra, ad esempio, come si possano restituire le intestazioni HTTP per la localizzazione di un file PDF disponibile in Inglese, Spagnolo e Tedesco:
Link: <https://www.mio-sito.it/en/doc.pdf>; rel="alternate"; hreflang="en", <https://www.mio-sito.it/es/doc.pdf>; rel="alternate"; hreflang="es", <https://www.mio-sito.it/de/doc.pdf>; rel="alternate"; hreflang="de"
Da notare come ciascun URL debba essere delimitato tramite i caratteri โ<..>โ, mentre le intestazioni devono essere separate tramite una virgola.
Targeting geografico e sitemap
Dato che le sitemap permettono di descrivere a Google la struttura di un sito Web, รจ possibile utilizzarle anche per indicare al motore di ricerca le pagine che sono state localizzate geograficamente per target linguistici specifici.
Tornando allโesempio dellโipotetico albergo di Stintino il codice seguente permette di comunicare a Google lโesistenza delle quattro pagine dedicate alla descrizione delle stanze della struttura rispettivamente in lingua italiana, inglese, tedesca e francese.
<url>
<loc>https://www.albergo-esempio.it/stanze.html</loc>
<xhtml:link
rel="alternate"
hreflang="it"
href="https://www.albergo-esempio.it/stanze.html"/>
<xhtml:link
rel="alternate"
hreflang="en"
href="https://www.albergo-esempio.it/en/rooms.html"/>
<xhtml:link
rel="alternate"
hreflang="de"
href="https://www.albergo-esempio.it/de/raume.html"/>
<xhtml:link
rel="alternate"
hreflang="fr"
href="https://www.albergo-esempio.it/fr/pieces.html"/>
</url>
Tale blocco di codice deve essere, ovviamente, ripetuto nella sitemap per ciascuna delle pagine, ricordandosi di riportare nuovamente nel blocco xhtml:link anche lโURL della pagina delimitata dagli elementi <loc>..</loc>. Lโordine con il quale vengono elencate le pagine non รจ rilevante ma si consiglia di mantenere sempre la medesima struttura per ciascun blocco <url>..</url> per migliorare la leggibilitร della sitemap ed agevolarne la comprensione da parte degli spider.
Best practices per siti multilingua e multiregionali
Struttura delle URL e targeting geografico
Il discorso sulla relazione tra targeting geografico e URL estende quello fatto in precedenza riguardo alle estensioni per i nomi a dominio. Anche in questo caso รจ bene sottolineare che, da solo, un URL non rappresenta unโinformazione sufficiente per permettere a Google di identificare con precisione le varie localizzazioni di un sito Web, si tratta perรฒ di un elemento in grado di facilitare tale processo.
In questo caso lโesempio piรน semplice potrebbe riguardare un URL come il seguente:
https://www.mio-sito.it
In questo caso il dominio in oggetto appare diretto nello specifico agli utenti di lingua italiana, esso ha sicuramente il vantaggio di restituire immediatamente lโinformazione relativa al targeting, introduce inoltre un elemento di disambiguazione facilmente leggibile che ha valore indipendentemente dal Paese in cui รจ residente il server utilizzato. Per contro si deve tenere in considerazione la necessitร di registrare un ccTLD differente per ciascuna localizzazione e le limitazioni che possono eventualmente essere imposte per la titolaritร di alcune estensioni geografiche.
Nel caso specifico di un sito disponibile in Italiano, Tedesco, Francese e Spagnolo, ad esempio, dovremo acquistare 4 differenti domini:
https://www.mio-sito.it https://www.mio-sito.de https://www.mio-sito.fr https://www.mio-sito.es
Una simile soluzione appare particolarmente idonea ad i siti multiregionali.
Unโaltra soluzione prevede lโutilizzo dei sottodomini a partire da nomi a dominio generici (come ad esempio COM o NET):
https://it.mio-sito.com
Tale alternativa, oltre a richiedere un minimo sforzo in termini di configurazione lato server, risulta molto piรน economica rispetto a quella precedente (si deve registrare un solo dominio) e non deve confrontarsi con eventuali limitazioni a carico dei ccTLD. Lโuso del codice linguistico per il sottodominio si presta perรฒ ad ambiguitร e, nello specifico, potrebbe non risultare chiara la distinzione tra siti Web multilingua e siti Web multiregionali.
Se non si desidera ricorrere ai sottodomini รจ possibile fare ricorso a delle sotto-directory generate allโinterno del medesimo host, in questo modo:
https://www.mio-sito.com/it/
Anche in questo caso le esigenze legate alle configurazioni sono di scarsa entitร e, come accade per i sottodomini, si puรฒ approfittare del targeting internazionale tramite la Search Console di Google. Rimangono perรฒ le ambiguitร riguardo alla destinazione del sito (multilingua o multiregionale?) e puรฒ essere molto macchinoso separare le varie localizzazioni tramite delle directory.
Google stessa sconsiglia invece le localizzazioni tramite passaggio di parametri in querystring:
https://www.mio-sito.com?lang=it
Questo per via della scarsa leggibilitร di tale formato, sia per gli utenti che per i motori di ricerca, che per la mancanza del supporto da Search Console. Rimangono inoltre gli elementi di ambiguitร citati per i due casi precedenti e le problematiche che potrebbero sorgere in seguito ad unโeccessiva segmentazione dei contenuti in un numero potenzialmente elevato di URL.
Lโimportanza della user experience
Gli spider di Google sono assolutamente in grado di riconoscere la lingua in cui รจ scritta una pagina web.
Dal punto di vista della user experience Google tenderebbe a privilegiare le pagine scritte in unโunica lingua mentre non apprezzerebbe i โmixโ di piรน lingue. Altro elemento importante รจ la qualitร del testo: i contenuti tradotti in modo approssimativo o generati tramite traduttori automatici, infatti, non sono graditi al motore di ricerca: potrebbero, infatti, essere facilmente interpretati come spam e trattati come tale.
Per creare contenuti multilingua graditi a Google, quindi, รจ bene rispettare alcune regole:
- evitare pagine aventi contenuti scritti in piรน lingue: andrebbero quindi evitate le pagine in cui lo stesso contenuto รจ ripetuto in piรน lingue diverse o quelle dove viene tradotto solo il contenuto centrale della pagina ma vengono lasciati menu, link, note e piรฉ di pagina nella lingua originale del sito;
- evitare traduzioni automatiche, sgrammaticate e approssimative: i contenuti tradotti in modo approssimativo o generati tramite traduttori automatici non sono graditi al motore di ricerca in quanto potrebbero essere scambiati per spam e trattati come tale.
Se nel vostro sito avete contenuti di questo tipo e non siete disposti a cancellarli o modificarli, sarebbe meglio evitare la scansione da parte dei crawler tramite file robots.txt o, preferibilmente, attraverso lโapposizione della apposita direttiva nofollow attraverso lโaggiunta dellโapposito metatag in pagina:
<meta name="robots" content="noindex, nofollow">