back to top

Sitemap: la guida completa

La Sitemap o mappa del sito รจ uno strumento in grado di aiutare lโ€™indicizzazione delle pagine del nostro sito web.

Per sitemap sโ€™intende un file contenente lโ€™indice di tutte le pagine presenti sul nostro sito web; Una sitemap puรฒ essere anche una semplice pagina realizzata in HTML linkata direttamente sul nostro sito, tuttavia con questo termine si fa riferimento, solitamente, ad un file XML formattato secono uno specifico protocollo: il protocollo Sitemap, appunto.

La sitemap (intesa quale file XML conforme agli standard definiti nel sito Sitemaps.org) รจ diventato uno strumento piuttosto conosciuto ed utilizzato grazie a Google che, nel 2005, ha accolto questo sistema allโ€™interno dei propri meccanisimi di indiczzazione.

Lo scopo della sitemap รจ quello di fornire allo spider un elenco completo delle pagine web presenti sul sito, al fine di consentire al motore di ricerca di vedere tutti i documenti, compresi quelli che โ€“ normalmente โ€“ sarebbero invisibili agli spider perchรจ non correttamente collegati alle altre pagine del sito.

Come giร  detto la struttura di Sitemap รจ in formato XML di cui il protocollo sitemap rappresenta un sotto-tipo; segue un esempio:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    <url>
        <loc>http://www.miosito.ext/</loc>
        <lastmod>2007-03-29</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>http://www.miosito.ext/pagina.html</loc>
        <lastmod>2007-03-29</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
</urlset>

Nella nostra sitemap di esempio abbiamo inserito due sole pagine (la home ed una pagina interna); il suo codice (per chiunque abbia una infarinatura di XML) risulta piuttosto semplice.

Innanzitutto definiamo la versione di XML ed utilizziamo una serie di tag predefiniti per la specifica di alcuni dati:

  • urlset โ€“ specifica lโ€™XML Schema (XSD) definito per il formato del file;
  • url โ€“ รจ il nodo della struttura XML;
  • loc โ€“ stabilisce la URL della pagina da segnalare a Google;
  • lastmod โ€“ indica la data dellโ€™ultima modifica alla pagina corrente (accetta la data in formato aaaa-mm-gg);
  • changefreq โ€“ indica la frequenza con cui la pagina viene aggiornata (daily quotidianamente, weekly settimanalmente, monthly mensilmente);
  • priority โ€“ indica lโ€™importanza della pagina da un massimo di 1.0 ad un minimo di 0.1.

Una volta creata la sitemap con lโ€™elenco delle nostre pagine (se il sito รจ piccolo possiamo farlo manualmente, in caso contrario รจ consigliabile fare ricorso ad un software ad hoc oppure ad uno strumento on-line come lโ€™XML Sitemap Generator che trovate su Toolset.it) dobbiamo caricare il file sitemap.xml (possiamo chiamarlo anche in altro modo) nella root del nostro spazio web.

Ora non ci resta che comunicare agli spider dove possono trovare la nostra sitemap; per farlo possiamo usare il file robots.txt aggiungendo questo codice:

Sitemap: http://www.miosito.ext/sitemap.xml

Assolutamente consigliato, inoltre, segnalare direttamente la sitemap a Google mediante gli strumenti per webmaster.

Pubblicitร 
Massimiliano Bossi
Massimiliano Bossi
Stregato dalla rete sin dai tempi delle BBS e dei modem a 2.400 baud, ho avuto la fortuna di poter trasformare la mia passione in un lavoro (nonostante una Laurea in Giurisprudenza). Adoro scrivere codice e mi occupo quotidianamente di comunicazione, design e nuovi media digitali. Orgogliosamente "nerd" sono il fondatore di MRW.it (per il quale ho scritto centinaia di articoli) e di una nota Web-Agency (dove seguo in prima persona progetti digitali per numerosi clienti sia in Italia che all'estero).