Como su nombre indica, un sitemap es el mapa de una web y re­pre­se­n­ta cómo está es­tru­c­tu­ra­da, in­clu­ye­n­do las carpetas y su­b­pá­gi­nas que la componen. Sin embargo, en la ac­tua­li­dad los we­b­ma­s­te­rs no ne­ce­sa­ria­me­n­te utilizan los mapas del sitio para facilitar la na­ve­ga­ción a los vi­si­ta­n­tes, pues los usuarios ya cuentan en las web con otros elementos que hacen el proceso más sencillo e intuitivo. Aun así, estos archivos es­que­ma­ti­za­dos no han quedado en absoluto obsoletos. Pero ¿para qué sirven realmente y cuántos tipos existen?

¿Qué es un sitemap?

Un sitemap (también conocido como mapa del sitio web, mapa del sitio o mapa web) es un archivo que presenta la es­tru­c­tu­ra je­ra­r­qui­za­da de todas las su­b­pá­gi­nas que componen una web, es decir, pro­po­r­cio­na una visión de conjunto de esta. Ima­gi­ne­mos por un momento la es­tru­c­tu­ra de una web simple: cada uno de los do­cu­me­n­tos HTML está guardado en carpetas di­fe­re­n­tes y se conectan entre sí mediante hi­pe­re­n­la­ces. Todo ello se deposita en el espacio web. En el mapa del sitio las páginas se indican junto a sus URL co­rre­s­po­n­die­n­tes.

En los primeros días de la World Wide Web, el mapa web servía para facilitar la na­ve­ga­ción. En muchas ocasiones se in­te­r­ca­la­ban como un marco adicional al contenido principal, pe­r­mi­tie­n­do a los usuarios pasar de una página a otra sin tener que clicar en los hi­pe­re­n­la­ces in­di­vi­dua­les. Pero con el tiempo, la na­ve­ga­ción se ha vuelto mucho más elegante, aunque no por ello los sitemaps han perdido su le­gi­ti­mi­dad, y es que, además de aumentar la usa­bi­li­dad de la web, permiten a los bu­s­ca­do­res acceder a su contenido.

Co­m­pa­ra­ti­va: XML vs. HTML

Se pueden di­s­ti­n­guir pri­n­ci­pa­l­me­n­te dos tipos di­fe­re­n­tes de sitemaps de­pe­n­die­n­do de si presentan un formato XML o HTML. Se recurrirá a los sitemaps HTML si se desea que los usuarios tengan acceso a los mapas web. En este caso, el mapa del sitio co­n­s­ti­tui­rá un documento más de la web y, como tal, podrá in­te­grar­se en la es­tru­c­tu­ra web igual que cualquier otra página HTML. Por su parte, los sitemaps XML están pensados para los bu­s­ca­do­res. XML, al igual que HTML, es un lenguaje de marcado, aunque con muchas más funciones.

¿Cuál de ellos habría que utilizar? Lo cierto es que ambos presentan ventajas e in­co­n­ve­nie­n­tes. Un archivo de na­ve­ga­ción en formato HTML es de utilidad para los vi­si­ta­n­tes, pues los enlaces les permiten orie­n­tar­se en una web cuando buscan algún resultado. El mapa del sitio acompaña a otros co­m­po­ne­n­tes de la web, por ejemplo, la función de búsqueda o la barra de na­ve­ga­ción, pensados todos ellos para mejorar la ex­pe­rie­n­cia del usuario. Por tanto, se trata de un elemento adicional que eleva la usa­bi­li­dad de la web. Eso sí, a día de hoy ya prá­c­ti­ca­me­n­te no se incluyen como marco, sino que se ponen a di­s­po­si­ción del usuario mediante un enlace en el en­ca­be­za­do o el pie de la página.

Un mapa web escrito en lenguaje XML puede en­tre­gar­se a la Google Search Console con el objetivo de dar al buscador un mayor en­te­n­di­mie­n­to de toda la web. Además, con este lenguaje es posible crear sitemaps de vídeos y es que a Google y al resto de bu­s­ca­do­res les resulta muy difícil leer el contenido de los archivos de vídeo, motivo por el que dependen de la in­fo­r­ma­ción indicada en los metadatos. Si se quiere que Google integre en la búsqueda de vídeos todos los vídeos que están incluidos en la propia web, es necesario crear un sitemap de vídeo. Este se trata de un archivo XML con in­fo­r­ma­ción de cada uno de los vídeos de la página: el título y la de­s­cri­p­ción de los archivos de vídeo, el URL de la subpágina en la que se encuentra, el enlace a las mi­nia­tu­ras y la ubicación del re­pro­du­c­tor de vídeo utilizado. Con las imágenes se sigue el mismo proceso.

Como webmaster no es obli­ga­to­rio de­ca­n­tar­se por un formato u otro, pues es posible trabajar con ambos al mismo tiempo, ofre­cie­n­do así los mejores re­su­l­ta­dos tanto para los usuarios como para las arañas de los bu­s­ca­do­res. Además, aunque el sitemap XML está es­pe­cia­l­me­n­te pensado para los motores de búsqueda, los bu­s­ca­do­res recurren también a los mapas web de HTML, pues presentan a las arañas todas las páginas de una web.

Hinweis

En el siguiente artículo de la Digital Guide puedes obtener más in­fo­r­ma­ción sobre lo que es capaz de hacer un sitemap XML.

Los sitemaps y SEO

Los sitemaps de­sem­pe­ñan un papel muy im­po­r­ta­n­te en la op­ti­mi­za­ción para los motores de búsqueda. ¿El motivo? Los bu­s­ca­do­res permiten que los programas (arañas o ra­s­trea­do­res web) examinen Internet para poder indexarlo y or­ga­ni­zar­lo de la mejor forma posible. Cuando este tipo de programa rastrea una web, sigue los enlaces internos para conocer el contenido, pero no se garantiza que sea capaz de llegar a cada una de las su­b­pá­gi­nas, más aún si se trata de una web muy extensa. Los sitemaps XML o HTML presentan a la araña del buscador el índice de una web con todas las su­b­pá­gi­nas, fa­ci­li­ta­n­do la in­de­xa­ción.

Las webs que no tienen una es­tru­c­tu­ra con páginas co­rre­c­ta­me­n­te enlazadas impiden a la araña de Google acceder a todo su contenido. Por ello, un sitemap que contenga los enlaces de cada una de las su­b­pá­gi­nas es de gran utilidad en estos casos. Aun así, Google no garantiza que la araña tenga en cuenta cada subpágina, aunque la pro­ba­bi­li­dad de que lo haga es sin duda mucho mayor. Esto ocurre también cuando una web es re­la­ti­va­me­n­te nueva y aún no hay enlaces externos que hagan re­fe­re­n­cia a ella.

Un sitemap XML ofrece a los bu­s­ca­do­res in­fo­r­ma­ción adicional de la página en cuestión: la fecha de creación, la fre­cue­n­cia con la que se edita, la relación con el resto de páginas y la re­le­va­n­cia del contenido con respecto a la web completa.

Aunque no­r­ma­l­me­n­te se indica que un sitemap HTML está orientado hacia los usuarios y su homólogo en formato XML a los bu­s­ca­do­res, ambos son im­po­r­ta­n­tes en el po­si­cio­na­mie­n­to en los bu­s­ca­do­res. Los sitemaps en formato HTML también influyen en el ranking de Google, pues, cuando se rastrea la web, también se tienen en cuenta estos do­cu­me­n­tos. Sin contar que, para es­ta­ble­cer la posición de una web en los re­su­l­ta­dos de Google, el buscador valora su usa­bi­li­dad y, como ya se ha dicho, los mapas de sitio en HTML son un elemento que facilita la na­ve­ga­ción por la web y, por tanto, aumenta su valor.

Cómo crear un sitemap

La creación del mapa de una web es muy sencilla, más si se utiliza un generador de sitemaps. En función del formato que se desea aplicar, el pro­ce­di­mie­n­to varía. Los sitemaps en HTML son, en principio, muy fáciles de crear, pues solo requiere que el usuario tenga algunos co­no­ci­mie­n­tos básicos de HTML, aunque son in­di­s­pe­n­sa­bles aquellos relativos a cómo marcar co­rre­c­ta­me­n­te los enlaces. Para ello, basta con utilizar el atributo href, el cual permite crear un listado de enlaces. No obstante, en la práctica, los we­b­ma­s­te­rs suelen hacer un esfuerzo mayor para crear sitemaps y, por ejemplo, adaptan su diseño al del resto de la web.

<li class="lpage"><a href="http://one-test.website/" title="Theme Preview – Previewing Another WordPress Blog">Theme Preview – Previewing Another WordPress Blog</a></li>
Theme Preview – Previewing Another WordPress Blog
<li class="lpage"><a href="http://one-test.website/about-us" title="About us – Theme Preview">About us – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/our-projects" title="Our Projects – Theme Preview">Our Projects – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/sample-page" title="Sample Page – Theme Preview">Sample Page – Theme Preview</a></li>
<li class="lpage"><a href="http://one-test.website/shop" title="Products – Theme Preview">Products – Theme Preview</a></li>

La creación de los archivos en formato XML es algo más compleja: aquí se inicia el mapa del sitio con una etiqueta <urlset>, donde se indica el protocolo estándar. A co­n­ti­nua­ción, se incluyen tantas etiquetas <url> como enlaces se quieran escribir en el sitemap, si bien el enlace a la subpágina en sí mismo se encierra en una etiqueta <loc>. Mientras que estos datos son obli­ga­to­rios, se pueden incluir de forma opcional las si­guie­n­tes etiquetas: <cha­n­ge­freq> (fre­cue­n­cia de edición), <lastmode> (fecha del último cambio) o <priority> (im­po­r­ta­n­cia de la página).

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
<url></url>
    <loc>http://one-test.website/</loc>
    <lastmod>2018-03-23T14:32:21+00:00</lastmod>
    <priority>1.00</priority>
<url></url>
    <loc>http://one-test.website/about-us</loc>
<lastmod>2018-03-23T14:32:21+00:00</lastmod>
    <priority>0.80</priority>

Quien quiera que el proceso sea aún más sencillo, puede evitar escribir el mapa del sitio a mano uti­li­za­n­do un generador de sitemaps. Tras in­tro­du­cir el URL principal de la web, el generador de sitemaps rastrea la web completa y crea un índice con todas las páginas que la componen. Estos servicios web están di­s­po­ni­bles tanto para HTML como para XML e incluso algunos de ellos son capaces de crear di­re­c­ta­me­n­te distintos tipos de mapas web. En algunos sistemas de gestión de contenido como WordPress los usuarios pueden recurrir a plugins es­pe­cí­fi­cos, pensados para crear los sitemaps de esa web.

Re­co­me­n­da­cio­nes de Google para sitemaps

Aunque la apa­rie­n­cia del documento de na­ve­ga­ción puede de­te­r­mi­nar­se con bastante libertad, Google establece algunas co­n­di­cio­nes para los sitemaps que hay que respetar si con ellos se pretende mejorar el ranking de búsqueda de la web. Un mapa web tiene que estar co­di­fi­ca­do en UTF-8, no ha de contener más de 50 000 URL y no debe superar los 50 MB. Este límite de tamaño es aplicable a los archivos no co­m­pri­mi­dos, por lo que si estos se pasan de los MB es­ta­ble­ci­dos, se puede optar por la co­m­pre­sión para reducir el tamaño.

En caso de que se trate de una web muy extensa, Google propone crear varios mapas de sitio. Al finalizar, se crea un archivo de índice que enlace a todos los sitemaps y pueda mostrarse a los bu­s­ca­do­res.

Consejo

No es obli­ga­to­rio incluir todas las su­b­pá­gi­nas de una web en el sitemap. En el caso de aquellas páginas a las que se puede acceder a través de di­fe­re­n­tes URL, es posible indicar solo uno de ellos (por ejemplo, aquellas que tienen el mismo contenido pero han sido diseñadas para distintos di­s­po­si­ti­vos). Se indican solo las llamadas páginas canónicas con las que Google debe trabajar.

Fi­na­l­me­n­te, existen dos po­si­bi­li­da­des para que Google conozca el sitemap. Por un lado, se puede cargar el archivo di­re­c­ta­me­n­te en la Google Console, y, por el otro, se puede añadir un enlace al archivo en el robots.txt. Hay que tener en cuenta que el archivo de texto está co­n­cre­ta­me­n­te diseñado para bu­s­ca­do­res y las arañas al rastrear acceden primero a él. Con un enlace al mapa del sitio en el servidor, el ra­s­trea­dor sabe dónde tiene que buscar.

Ir al menú principal