Creare sitemap.xml (.. chi è costui ??!)

Lo strumento per comunicare con Google e gli altri motori di ricerca.

“Le Sitemap consentono ai webmaster di indicare ai motori di ricerca le pagine dei loro siti disponibili per la scansione. Nella sua forma più semplice, una Sitemap è un file XML contenente gli URL di un sito insieme ai rispettivi metadati aggiuntivi (data dell’ultimo aggiornamento, frequenza tipica delle modifiche, importanza rispetto agli altri URL del sito) che consente ai motori di ricerca di eseguire la scansione del sito in modo più efficiente. In genere, i crawler web individuano le pagine dai link presenti sul sito e da altri siti. Questi dati vengono aggiunti per consentire ai crawler che supportano Sitemaps di selezionare tutti gli URL nella Sitemap e di ottenere informazioni relative a tali URL tramite i metadati associati. L’utilizzo del Protocollo Sitemap non garantisce l’inclusione delle pagine web nei motori di ricerca, ma facilita il processo di scansione del tuo sito da parte dei crawler web”.

Sitemaps.org

È questa la stringente ufficiale e inconfutabile definizione che il sito del “consorzio” Sitemaps.org dà della sitemap.xml ovviamente e delle sue caratteristiche. Una definizione inconfutabile perché scritta dai membri del consorzio stesso, degli aderenti al “Protocollo Sitemap 0.9”, ovvero Google, Yahoo! e Microsoft (Bing).

Fu Google anni fa a inventarsi l’utilizzo di un file di testo chiamato sitemap.xml che avrebbe dovuto permettere a webmaster e creatori di siti di dare vita a una mappa del proprio lavoro da spedire direttamente ai motori di ricerca comunicando loro in questo modo esattamente cosa da quel momento in poi avrebbero trovato, e quanta importanza ogni pagina e categoria del loro sito avesse e quindi sulla quale si desiderasse si fosse indagato.

Una sorta di comunicazione frontale con i motori di ricerca e con i loro crawler, o robots,  spiders e bots, tramite la quale si può dire e suggerire loro tutte le pagine che compongono il sito, anche quelle altrimenti ignorate dagli ispettori dei motori di ricerca, e tutti i metadati, fondamentali per la comunicazione e per le strategie online attuali. Contenuti per mobile, video, immagini, notizie, codice dell’eventuale CMS utilizzato ( linkare CMS) per scrivere e realizzare il sito, informazioni geografiche. Una dichiarazione di intenti quindi, semplice e chiara con la quale mettersi subito alla pari con l’attività di chi deve riportarci ai navigatori del web.

L’importanza intrinseca nella Sitemap deriva dal fatto di consegnare al webmaster la possibilità di raccontare agli spider tutto, pagine altrimenti poco visibili o poco linkate, pagine errate, la priorità di indicizzazione, la frequenza di aggiornamento, la data di ultima modifica.

Dovendo dare ulteriormente un senso e una giustificazione alla sua esistenza, potremmo accomunarla a quella del robots.txt. Dove se questo è la porta che apre o chiude agli spider, l’altra è l’ospite che illustra in dettaglio al nuovo arrivato tutte le stanze e cosa potrà trovarci.

Come si crea.

Programmatori ed esperti di informatica potrebbero ovviamente creare una Sitemap a mano scrivendola di proprio pugno. Con un semplice bloc notes. In rete e nei CMS però esistono rispettivamente semplici tools  e plugin che permettono di crearne una per sé, spuntare le voci opportune e ottenere un file.xml da segnalare.

Con WordPress è possibile creare una Sitemap.xml per il sito realizzato con il CMS attraverso semplici plug-in facili da installare e veloci.

Tra questi potremmo ricordare ancora quello di Google stesso, come il

Google XML Sitemap Generator for WordPress

oppure

XML – Sitemaps.com

XML Sitemap Generator – Free Unlimited Pages

Google permette di segnalare a sé una Sitemap tramite Google Webmaster Tools, anzi potremmo affermare che la creazione degli strumenti per web master da parte di Google sia dipesa principalmente dalla necessità di invio e sua ricezione di Sitemap. In questo modo:

“Carica la Sitemap sul tuo sito.Nella home page di Strumenti per i Webmaster, fai clic sul sito desiderato. Sotto Configurazione sito, fai clic su Sitemap. Nella casella di testo, completa il percorso alla tua Sitemap. Fai clic su Invia Sitemap”.

Modalità analoghe e simili permetto di inviare la propria Sitemap ai Bing  e Yahoo!. Tali modalità compresa quella di Google vengono chiamate in gergo e di norma “Submisison”.

Un altro modo per segnalare la Sitemap ideato e introdotto nel 2007 è l’utilizzo del robots.txt. Esiste infatti la possibilità di inserire l’URL della propria mappa all’interno del robots.txt in una riga indipendente e comunicare quindi al motore di ricerca l’esistenza della mappa tramite il file che verrà interrogato quotidianamente.

Un ultima modalità riguarda l’uso del Ping, un avviso, ovvero parlare direttamente con i motori ci ricerca. Nella barra del proprio browser si inserisce un URL precompilato dal motore di ricerca e da chiudere con il proprio indirizzo sitemap.xml. Google, ASK e Yahoo! utilizzato per tale funzione questi URL:

  • Linkare (http://www.google.com/webmasters/sitemaps/ping?sitemap=LINK_SITEMAP;
  • http://submissions.ask.com/ping?sitemap=LINK_SITEMAP;
  • http://search.yahooapis.com/SiteExplorerService/V1/updateNotification?appid=YahooDemo&url=LINK_SITEMAP.

Per lanciare un Ping basta inserire l’Url della propria Sitemap al posto di LINK_SITEMAP.

Analizzare una mappa.

Webmaster Tools di Google, come del resto gli strumenti simili messi a disposizione dei webmaster sia da Yahoo! che da Bing offrono una diagnosi continua del sito segnalato e in caso di necessità spediscono all’autore del sito messaggi relativi a eventuali errori,malware, errori nella Sitemap e nella sua segnalazione. Invitando sovente l’autore della stessa mappa e segnalare la stessa di nuovo e corretta.

Sitemap Index.

La Sitemap non può consistere in un file dalle dimensioni illimitate. Ha dei paletti, grandissimi ma comunque presenti. I limiti inderogabili alla mole della mappa sono: 50.000 URL o 10 mega. Esistono è facile intuirlo siti dispongono di strutture che superano e di molto i 50.000 URL, che avrebbero quindi una mappa necessariamente più grande delle dimensioni consentite.

Per questi siti è stato introdotto il protocollo Sitemap Index. La Sitemap Index è una sorta di titolo d’insieme che riassume tutte le mappe subordinate, previste per esempio per varie sezioni e sottodomini di un grande sito. All’intero del tag “sitemapindex” in fase di scrittura, si andranno a inserire vari tag, uno per ogni sitemap che si vuole porre sotto l’ombrello della maggiore.

A quel punto, una volta creato il grappolo, in fase di segnalazione non si deve far altro che segnalare la Sitemap Index, dalla quale i crawler riusciranno poi a capire e indagare l’intera sottostruttura.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *