back to top

Sitemap: la guida completa

La Sitemap o mappa del sito è uno strumento in grado di aiutare l’indicizzazione delle pagine del nostro sito web.

Per sitemap s’intende un file contenente l’indice di tutte le pagine presenti sul nostro sito web; Una sitemap può essere anche una semplice pagina realizzata in HTML linkata direttamente sul nostro sito, tuttavia con questo termine si fa riferimento, solitamente, ad un file XML formattato secono uno specifico protocollo: il protocollo Sitemap, appunto.

La sitemap (intesa quale file XML conforme agli standard definiti nel sito Sitemaps.org) è diventato uno strumento piuttosto conosciuto ed utilizzato grazie a Google che, nel 2005, ha accolto questo sistema all’interno dei propri meccanisimi di indiczzazione.

Lo scopo della sitemap è quello di fornire allo spider un elenco completo delle pagine web presenti sul sito, al fine di consentire al motore di ricerca di vedere tutti i documenti, compresi quelli che – normalmente – sarebbero invisibili agli spider perchè non correttamente collegati alle altre pagine del sito.

Come già detto la struttura di Sitemap è in formato XML di cui il protocollo sitemap rappresenta un sotto-tipo; segue un esempio:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>http://www.miosito.ext/</loc>
        <lastmod>2007-03-29</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>http://www.miosito.ext/pagina.html</loc>
        <lastmod>2007-03-29</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
</urlset>

Nella nostra sitemap di esempio abbiamo inserito due sole pagine (la home ed una pagina interna); il suo codice (per chiunque abbia una infarinatura di XML) risulta piuttosto semplice.

Innanzitutto definiamo la versione di XML ed utilizziamo una serie di tag predefiniti per la specifica di alcuni dati:

  • urlset – specifica l’XML Schema (XSD) definito per il formato del file;
  • url – è il nodo della struttura XML;
  • loc – stabilisce la URL della pagina da segnalare a Google;
  • lastmod – indica la data dell’ultima modifica alla pagina corrente (accetta la data in formato aaaa-mm-gg);
  • changefreq – indica la frequenza con cui la pagina viene aggiornata (daily quotidianamente, weekly settimanalmente, monthly mensilmente);
  • priority – indica l’importanza della pagina da un massimo di 1.0 ad un minimo di 0.1.

Una volta creata la sitemap con l’elenco delle nostre pagine (se il sito è piccolo possiamo farlo manualmente, in caso contrario è consigliabile fare ricorso ad un software ad hoc oppure ad uno strumento on-line come l’XML Sitemap Generator che trovate su Toolset.it) dobbiamo caricare il file sitemap.xml (possiamo chiamarlo anche in altro modo) nella root del nostro spazio web.

Ora non ci resta che comunicare agli spider dove possono trovare la nostra sitemap; per farlo possiamo usare il file robots.txt aggiungendo questo codice:

Sitemap: http://www.miosito.ext/sitemap.xml

Assolutamente consigliato, inoltre, segnalare direttamente la sitemap a Google mediante gli strumenti per webmaster.

Pubblicità
Massimiliano Bossi
Massimiliano Bossi
Stregato dalla rete sin dai tempi delle BBS e dei modem a 2.400 baud, ho avuto la fortuna di poter trasformare la mia passione in un lavoro (nonostante una Laurea in Giurisprudenza). Adoro scrivere codice e mi occupo quotidianamente di comunicazione, design e nuovi media digitali. Orgogliosamente "nerd" sono il fondatore di MRW.it (per il quale ho scritto centinaia di articoli) e di una nota Web-Agency (dove seguo in prima persona progetti digitali per numerosi clienti sia in Italia che all'estero).