La Sitemap o mappa del sito รจ uno strumento in grado di aiutare lโindicizzazione delle pagine del nostro sito web.
Per sitemap sโintende un file contenente lโindice di tutte le pagine presenti sul nostro sito web; Una sitemap puรฒ essere anche una semplice pagina realizzata in HTML linkata direttamente sul nostro sito, tuttavia con questo termine si fa riferimento, solitamente, ad un file XML formattato secono uno specifico protocollo: il protocollo Sitemap, appunto.
La sitemap (intesa quale file XML conforme agli standard definiti nel sito Sitemaps.org) รจ diventato uno strumento piuttosto conosciuto ed utilizzato grazie a Google che, nel 2005, ha accolto questo sistema allโinterno dei propri meccanisimi di indiczzazione.
Lo scopo della sitemap รจ quello di fornire allo spider un elenco completo delle pagine web presenti sul sito, al fine di consentire al motore di ricerca di vedere tutti i documenti, compresi quelli che โ normalmente โ sarebbero invisibili agli spider perchรจ non correttamente collegati alle altre pagine del sito.
Come giร detto la struttura di Sitemap รจ in formato XML di cui il protocollo sitemap rappresenta un sotto-tipo; segue un esempio:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.google.com/schemas/sitemap/0.84"> <url> <loc>http://www.miosito.ext/</loc> <lastmod>2007-03-29</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> <url> <loc>http://www.miosito.ext/pagina.html</loc> <lastmod>2007-03-29</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> </urlset>
Nella nostra sitemap di esempio abbiamo inserito due sole pagine (la home ed una pagina interna); il suo codice (per chiunque abbia una infarinatura di XML) risulta piuttosto semplice.
Innanzitutto definiamo la versione di XML ed utilizziamo una serie di tag predefiniti per la specifica di alcuni dati:
- urlset โ specifica lโXML Schema (XSD) definito per il formato del file;
- url โ รจ il nodo della struttura XML;
- loc โ stabilisce la URL della pagina da segnalare a Google;
- lastmod โ indica la data dellโultima modifica alla pagina corrente (accetta la data in formato aaaa-mm-gg);
- changefreq โ indica la frequenza con cui la pagina viene aggiornata (daily quotidianamente, weekly settimanalmente, monthly mensilmente);
- priority โ indica lโimportanza della pagina da un massimo di 1.0 ad un minimo di 0.1.
Una volta creata la sitemap con lโelenco delle nostre pagine (se il sito รจ piccolo possiamo farlo manualmente, in caso contrario รจ consigliabile fare ricorso ad un software ad hoc oppure ad uno strumento on-line come lโXML Sitemap Generator che trovate su Toolset.it) dobbiamo caricare il file sitemap.xml (possiamo chiamarlo anche in altro modo) nella root del nostro spazio web.
Ora non ci resta che comunicare agli spider dove possono trovare la nostra sitemap; per farlo possiamo usare il file robots.txt aggiungendo questo codice:
Sitemap: http://www.miosito.ext/sitemap.xml
Assolutamente consigliato, inoltre, segnalare direttamente la sitemap a Google mediante gli strumenti per webmaster.