back to top

SEO: gestire gli errori 404

Prendo spunto da un recente intervento di Matt Cutts per affrontare un argomento poco dibattuto in ambito SEO, cioè l’importanza degli (eventuali) error code restituiti dal nostro server quando la chiamata di una risorsa web, per un qualche motivo, non va a buon fine. L’errore più frequente, come tutti sappiamo, è sicuramente il famosissimo 404 cioè pagina non trovata (o Page Not Found in inglese).

Page Not Found

Questo errore, come lascia intuire il nome, viene restituito dal web-server quando una data risorsa (un file HTML, un’immagine, uno script, ecc.) NON è più presente all’interno del nostro spazio web. Le cause più frequenti di questo errore sono la rimozione di un contenuto oppure il suo spostamento o cambio di nome. In tutti questi casi il nostro server invierà al client che richiede la risorsa il famigerato errore 404.

Google e gli errori 404

Ma cosa succede quando lo spider di Google scansiona il nostro sito web e non trova una pagina web che fino a poco tempo fa era regolamente presente sul nostro sito (e correttamente indicizzata da Google)?

Ufficialmente Google ha dichiarato che il numero di errori 404 restituiti da un sito web non ne influenzano il posizionamento. Ufficialmente.

Nella realtà dei fatti, tuttavia, un numero consistente di errori 404 può avere un impatto molto negativo sul posizionamento del nostro sito web: se è vero (come ci dice Google) che gli errori 404 non sono causa di "penalizzazione" è altrettanto vero che una cattiva (o peggio mancata) gestione di questi errori può portare ad un vero e proprio degrado del "fattore SEO" del nostro sito.

Errori 404 e perdita di posizionamento

Come detto un elevato numero di status code 404 può essere un serio problema dal punto di vista del SEO: ogni pagina che scompare, infatti, comporta un deterioramento in quanto:

  • si compromette la qualità complessiva del sito (si generano, ad esempio, broken links) che è uno dei fattori presi in considerazione dagli algoritmi di ranking;
  • si creano degli stop point per i crawler che, arrivati in una pagina 404, potrebbero ritrovarsi senza più alcun link da seguire;
  • si ha una perdita di link juice in quanto quella pagina (soprattutto se aveva una certa anzianità) contribuiva a passare valore anche alle altre pagine del sito all’interno di un contesto di cross-linking;
  • si perde l’apporto degli inbound links e dei social signals eventualmente guadagnati da quella pagina;
  • si corre un elevato rischio di perdita di traffico in quanto l’utente che arriva su una pagina 404 non ha avuto accesso alla risorsa che cercava e potrebbe uscire dal sito per cercarla altrove.

Monitorare gli errori 404 prodotti dal nostro sito

Alla luce delle osservazioni fatte poco sopra appare evidente come il monitoraggio costante dello stato di salute del nostro sito e dell’eventuale aumento degli errori 404 sia un’attività ineludibile.

Il modo migliore per tenere sott’occhio eventuali problematiche di questo tipo è l’utilizzo (quotidiano o quasi) dei Google Webmaster Tools i quali offrono, tra le altre cose, un dettagliato report circa gli errori di scansione.

Scansione > Errori di scansione
Google Webmaster Tool - Errori di scansione

Attraverso questa indispensabile risorsa potremo essere sempre al corrente sugli errori generati dal nostro sito, la data di ultimo rilevamento dell’errore e gli eventuali link seguiti dallo spider per giungere alla pagina 404.

Come gestire gli errori 404

Vista l’importanza degli errori 404 è bene saperli gestire correttamente.

E’ bene precisare che la produzione di errori 404, soprattutto per siti di grandi dimensioni, è normale! Nella vita di un sito prima o poi sorge necessariamente l’esigenza di cancellare o spostare un contenuto… saper gestire correttamene queste evenienze, quindi, è indispensabile.

Le soluzioni per gestire correttamente simili eventualità variano a seconda dell’evento che ha reso irreperibile la risorsa web:

  • Spostamento o cambio di nome – In questi casi la soluzione ideale è implementare un redirect 301, in questo modo, infatti, sia gli utenti che gli spider vengono trasferiti verso la nuova URL della risorsa spostata o rinominata;
  • Cancelazione – La soluzione ottimale consiste nell’implementazione di una pagina personalizzata di errore 404 che offra, tanto agli spider quanto agli utenti, pecorsi di navigazione alternativi. La cosa peggiore da fare? Lasciare la pagina di defaul del web server!
Pagina 404 personalizzata

Errori comuni nella gestione degli errori 404

Vediamo di seguito alcuni errori frequenti nella gestione delle problematiche legate allo status code 404:

  • Gestire sempre l’errore 404 con un redirect – Si tratta di un errore piuttosto comune: come detto un redirect 301 è una buona idea ma solo se il contenuto esiste ancora… viceversa non fate redirect su pagine che non c’entrano nulla col contenuto cancellato (come ad esempio l’home-page) in quanto ciò non si tradurrebbe in una buona user experience per i vostri utenti.
  • Attenzione alle pagine di errore "soft" – Assicuratevi che lavostra pagina di errore produca sempre uno status code 404, viceversa se la vostra pagina di errore producesse uno status code 200 la cosa potrebbe rivelarsi piuttosto dannosa in quanto gli spider interpreterebbero il contenuto NON come un messaggio di errore ma come una comune pagina web!
  • La rimozione del contenuto è immediata e definitiva? – In questo caso non usate lo status code 404 ma il 410: questo codice di stato HTTP indica che la risorsa richiesta non è più disponibile e non lo sarà mai più!

Conclusioni

Per concludere vorrei fare un piccolo elenco di best practices per la gestione degli errori 404 in ambito SEO:

  • non fatevi prendere dal panico: gli errori 404 sono normali soprattutto per siti grandi e/o di una certa anzianità;
  • se il contenuto è stato spostato o rinominato utilizzare sempre un redirect con status 301 moved permanently;
  • se il contenuto è stato cancellato evitate redirect azzardati come, ad esempio, redirect massivi verso la home del sito o verso pagine per nulla attinenti col contenuto rimosso;
  • se il contenuto rimosso poteva contare su un buon numero di link in ingresso e/o produceva traffico cercate di ripristinarlo con un contenuto analogo o molto affine;
  • se il contenuto rimosso non può essere sostituito gestite l’errore 404 con una pagina personalizzata che offra ad utenti e percorsi alternativi di navigazione;
  • monitorate costantemente i Google Webmaster Tool per tenere sott’occhio eventuali errori 404 dovuti ad eventi imprevisti come errori o bug del vostro CMS.

Un’ultima considerazione: se la creazione di pagine 404 personalizzate è molto utile per gli utenti del sito, ad oggi non è possibile dire altrettanto per i motori di ricerca: il 18 gennaio 2015 John Mueller (Google) ha dichiarato via Twitter che le pagine 404 non passano link juice ad altre pagine del sito ed hanno senso solo per gli utenti e non per gli spider.

Pubblicitร 
Massimiliano Bossi
Massimiliano Bossi
Stregato dalla rete sin dai tempi delle BBS e dei modem a 2.400 baud, ho avuto la fortuna di poter trasformare la mia passione in un lavoro (nonostante una Laurea in Giurisprudenza). Adoro scrivere codice e mi occupo quotidianamente di comunicazione, design e nuovi media digitali. Orgogliosamente "nerd" sono il fondatore di MRW.it (per il quale ho scritto centinaia di articoli) e di una nota Web-Agency (dove seguo in prima persona progetti digitali per numerosi clienti sia in Italia che all'estero).