Aquellos que se preocupan es­pe­cia­l­me­n­te por la in­de­xa­ción de su página web en los re­su­l­ta­dos de los motores de búsqueda saben que existen numerosos factores que influyen en la lucha por los primeros puestos. Por ejemplo, la lista de elementos que afectan a la cla­si­fi­ca­ción en Google incluye más de 200 criterios, algunos de los cuales ha co­n­fi­r­ma­do el propio Matt Cutts, antiguo director del de­pa­r­ta­me­n­to contra spam de Google. Sin embargo, hay muchos otros que solo son hipótesis. No es ca­sua­li­dad que la op­ti­mi­za­ción para los motores de búsqueda sea un desafío de cada webmaster que quiere que su sitio web sea visible y accesible a largo plazo. Mientras que algunos factores como las palabras clave re­le­va­n­tes, el contenido de calidad o el diseño re­s­po­n­si­vo están en boca de todos, el valor de un buen sitemap XML a menudo se subestima.

¿Qué es un sitemap XML?

Un sitemap XML (sitemap.xml) es un archivo de texto en formato XML (Ex­te­n­si­ble Markup Language) que contiene una lista de todas las su­b­pá­gi­nas de una página web en forma de enlace. Como tal, se puede subir a la Search Console de Google o a las he­rra­mie­n­tas para We­b­ma­s­te­rs de Bing para informar a los ra­s­trea­do­res de los motores de búsqueda de todas las páginas di­s­po­ni­bles y re­le­va­n­tes y acelerar y optimizar así el proceso de in­de­xa­ción. Los sitemaps XML deben cumplir los re­qui­si­tos del protocolo Sitemaps, que fue adoptado como estándar por Google, Yahoo y Microsoft en 2006 con el objetivo de mejorar la calidad de los re­su­l­ta­dos de búsqueda a largo plazo. Por tanto, el estándar re­co­mie­n­da tanto la co­di­fi­ca­ción en UTF-8 y el me­n­cio­na­do lenguaje de marcado XML como el uso de códigos de entidad para ciertos ca­ra­c­te­res ("&gt" en lugar de ">").

Nota

Los sitemaps XML son di­fe­re­n­tes de los mapas del sitio que muchos CMS muestran au­to­má­ti­ca­me­n­te en la interfaz. Estos co­n­s­ti­tu­yen el índice del sitio web, que tiene por objeto facilitar la na­ve­ga­ción de los vi­si­ta­n­tes. Sin embargo, de forma pre­de­te­r­mi­na­da los usuarios no pueden ver los sitemaps, aunque ge­ne­ra­l­me­n­te es posible hacerlos ac­ce­si­bles a través de su URL.

Las ventajas de un sitemap XML

Aunque no hay garantía de que la in­de­xa­ción, en Google y en otros bu­s­ca­do­res, mejore siempre que se sube un sitemap XML, los di­re­c­to­rios de enlaces es­tru­c­tu­ra­dos aumentan las po­si­bi­li­da­des en cualquier caso. Un índice con todos los co­n­te­ni­dos fá­ci­l­me­n­te ac­ce­si­bles a las arañas puede ser rentable, es­pe­cia­l­me­n­te para páginas con contenido dinámico que están sujetas a cambios co­n­s­ta­n­tes. Lo mismo se aplica a proyectos web más grandes que tienen un gran número de su­b­pá­gi­nas pero ninguna es­tru­c­tu­ra de backlinks extensa (todavía). Estas páginas tienden a recibir menos visitas por parte de las arañas de los bu­s­ca­do­res, por lo que un archivo sitemap.xml puede ayudarte a que los robots rastreen estas páginas de forma más eficaz.

Otra ventaja: los sitemaps XML no solo pueden recoger los URL de las su­b­pá­gi­nas, sino también archivos mu­l­ti­me­dia como vídeos o imágenes. Para estos, hay incluso etiquetas adi­cio­na­les que indican a los robots qué tipo de contenido es (<image>, <video>). Además, se pueden utilizar atributos que describan el contenido con más detalle o que es­pe­ci­fi­quen su duración para que los motores de búsqueda puedan re­gi­s­trar­lo mejor. También existe una versión especial de sitemap XML para portales de noticias que promete una in­di­za­ción op­ti­mi­za­da de los artículos gracias a atributos es­pe­cí­fi­cos como género, fecha de pu­bli­ca­ción o título.

Consejo

Aunque el sitemap XML se puede realizar a mano, hay ge­ne­ra­do­res que lo elaboran de forma au­to­má­ti­ca, como el generador online de XML Sitemaps.com. Además, para la mayoría de los sistemas de gestión de co­n­te­ni­dos existen plugins que au­to­ma­ti­zan la creación de sitemaps XML.

Es­tru­c­tu­ra de un sitemap XML: co­m­po­ne­n­tes más im­po­r­ta­n­tes

Al igual que con cualquier documento en lenguaje de marcas ex­te­n­si­ble, el formato de un mapa del sitio funciona con etiquetas XML. Según el estándar actual "Sitemaps 0.9", hay tres etiquetas obli­ga­to­rias para poder hablar de un sitemap XML:

<urlset>, </urlset> Cada archivo de un sitemap XML debe comenzar con una etiqueta de apertura <urlset> y terminar con una etiqueta de cierre </urlset>. La etiqueta tiene la función de resumir el archivo y hace re­fe­re­n­cia al protocolo estándar actual.
<url>, </url> Las etiquetas <url> de apertura y de cierre son su­pe­rio­res a las entradas de URL in­di­vi­dua­les y, por lo tanto, indican el comienzo y el final de una subpágina de la lista.
<loc>, </loc> La etiqueta <loc> ide­n­ti­fi­ca a cada una de las páginas del proyecto web o sus URL. El URL debe comenzar siempre con el protocolo (por ejemplo, "http") y terminar con una barra oblicua de cierre (si lo requiere el servidor web). También se define una longitud máxima de 2.048 ca­ra­c­te­res.

Aparte de estos atributos XML obli­ga­to­rios, hay etiquetas adi­cio­na­les como <priority>, <lastmod> y <cha­n­ge­freq> para es­pe­ci­fi­car las entradas de URL in­di­vi­dua­les. Sin embargo, el grado de co­m­pa­ti­bi­li­dad de estas etiquetas op­cio­na­les depende del motor de búsqueda co­rre­s­po­n­die­n­te. Por ejemplo, el ra­s­trea­dor de Google utiliza pri­n­ci­pa­l­me­n­te marcas <lastmod> para la in­de­xa­ción, mientras que ignora en gran medida los otros dos atributos o solo les permite fluir mí­ni­ma­me­n­te en el proceso de rastreo.

sitemap.xml: etiquetas op­cio­na­les

<lastmod>, </lastmod> Mediante la etiqueta <lastmod> se puede es­pe­ci­fi­car la fecha (formato W3C) del último cambio de una página. La etiqueta es in­de­pe­n­die­n­te de la cabecera "if modified since" que el servidor web puede devolver como parte de una respuesta HTTP 304.
<cha­n­ge­freq>, </cha­n­ge­freq> La etiqueta <cha­n­ge­freq> pro­po­r­cio­na a los robots de los bu­s­ca­do­res in­fo­r­ma­ción general sobre la fre­cue­n­cia con la que se espera que se actualice una página (cada hora, cada día, cada mes, etc.). Los do­cu­me­n­tos que cambian con cada acceso se marcan con el valor "siempre", los URL ar­chi­va­dos con "nunca".
<priority>, </priority> Con esta etiqueta, la prioridad de un URL dentro de la página web puede ex­pre­sar­se en una escala de 0,0 a 1,0 (prioridad por defecto: 0,5). De este modo, los ra­s­trea­do­res pueden conocer las páginas cuya in­de­xa­ción es es­pe­cia­l­me­n­te im­po­r­ta­n­te.

Dado que un archivo sitemap XML puede contener un máximo de 50 000 URL y no puede superar los 50 MB, los URL de páginas web más grandes también pueden re­pa­r­ti­r­se en varios do­cu­me­n­tos. Sin embargo, en este caso, cada uno de los do­cu­me­n­tos del mapa de sitio debe figurar en un archivo de índice adicional cuya es­tru­c­tu­ra no difiere en principio de la de los archivos del mapa de sitio: las etiquetas <si­te­ma­pi­n­dex> y <sitemap> deben uti­li­zar­se en lugar de <urlset> y <url>.

Nota

Es posible comprimir archivos sitemap (por ejemplo, con gzip), pero solo es re­co­me­n­da­ble para reducir los re­qui­si­tos de ancho de banda. El tamaño máximo de un sitemap no puede au­me­n­tar­se de esta forma, ya que el límite se aplica siempre a la versión de­s­co­m­pri­mi­da del archivo.

Ejemplo de sitemap XML

La forma más fácil de entender la es­tru­c­tu­ra de un sitemap XML es utilizar un ejemplo concreto:

<!--?xml version="1.0" encoding="UTF-8"?-->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
	<url></url>
		<loc>http://one-test.website/</loc>
		<lastmod>2018-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>1.0</priority>
	
	<url></url>
		<loc>http://one-test.website/page1/</loc>
		<lastmod>2018-03-05</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.5</priority>
	
	<url></url>
		<loc>http://one-test.website/page2/</loc>
		<lastmod>2018-03-08</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.3</priority>

En este caso, nuestro sitemap XML de ejemplo incluye el URL principal one-test.website y los URL de dos su­b­pá­gi­nas (página 1 y página 2). Los ra­s­trea­do­res de los motores de búsqueda pueden ver en el documento que el webmaster ha dado la máxima prioridad a la página principal y que los cambios se realizan apro­xi­ma­da­me­n­te una vez al mes. El último ajuste se realizó el 1 de enero de 2018. La página 1 tiene el valor de prioridad pre­de­te­r­mi­na­do (0,5) pero, a di­fe­re­n­cia de la página principal, se estima que se ajustará se­ma­na­l­me­n­te (se prevé que la última mo­di­fi­ca­ción tenga lugar el 5 de marzo de 2018). Si el robot trabaja con el atributo de prioridad del sitemap, sabe que debe prestar una menor atención a la página 2 durante la in­de­xa­ción (<prioridad> con valor 0.3). La parte inferior también se modifica se­ma­na­l­me­n­te (última mo­di­fi­ca­ción, el 8 de marzo de 2018).

Creación y envío de un sitemap XML: cómo funciona

Dada la enorme cantidad de trabajo que implica la creación manual de un mapa del sitio, la elección de plugins o de he­rra­mie­n­tas en línea es una buena opción siempre que se utilicen co­rre­c­ta­me­n­te. Los sitemaps XML pueden generarse sin co­n­fi­gu­ra­cio­nes es­pe­cí­fi­cas, pero es mejor que realices ajustes in­di­vi­dua­les para que el documento cumpla con las co­n­di­cio­nes que te interesan. A modo de ejemplo, te pre­se­n­ta­mos las po­si­bi­li­da­des que ofrece el generador en línea de XML-Sitemaps.com y el plugin de WordPress Google XML Sitemaps para la creación e in­te­gra­ción de estos do­cu­me­n­tos.

Generar sitemaps uti­li­za­n­do el generador en línea XML-Sitemaps.com

Desde 2005, el generador en línea de XML-Sitemaps.com ofrece a los usuarios una buena solución para crear sus propios sitemaps XML. El servicio web es gratuito para páginas web de hasta 500 su­b­pá­gi­nas, mientras que las páginas más grandes deben tener un plan de su­s­cri­p­ción de pago. El pro­ce­di­mie­n­to es muy sencillo: después de entrar en la apli­ca­ción web, inserta el URL de tu página web en la barra de di­re­c­cio­nes:

Utiliza el botón "Más opciones" para indicar si las entradas del sitemap deben es­pe­ci­fi­car­se mediante el atributo <lastmod>, <priority> o <cha­n­ge­freq>. La primera puede activarse o des­ac­ti­var­se, mientras que la segunda permite ajustar la fre­cue­n­cia de ac­tua­li­za­ción deseada (horaria, diaria, semanal, etc.) si se desea utilizar esta opción de eti­que­ta­do. De lo contrario, si­m­ple­me­n­te mantén el ajuste pre­de­te­r­mi­na­do "No es­pe­ci­fi­car".

Haz clic en "START" para iniciar el proceso de ge­ne­ra­ción, cuya duración depende del tamaño de tu página web. Una vez fi­na­li­za­do el proceso, podrás vi­sua­li­zar el resultado en " VIEW SITEMAP DETAILS" > " VIEW FULL XML SITEMAP".

Utiliza el botón “Descargar” para bajar el archivo generado y cargarlo en el di­re­c­to­rio raíz de tu página web. Para informar al ra­s­trea­dor de Google sobre la exi­s­te­n­cia del archivo, envíalo a la Search Console de Google (requiere una cuenta de Google y la entrada del sitio web como propiedad). También puedes es­pe­ci­fi­car la ruta en la que se puede encontrar el sitemap en cualquier parte del archivo robots.txt:

Sitemap: http://one-test.website/sitemap.xml

Google XML Sitemaps: crear sitemaps con el plugin de WordPress

Desde hace más de una década, el plugin de WordPress Google XML Sitemaps, de­sa­rro­lla­do por Arne Brachhold, ha hecho que la creación de Sitemaps XML para una página web sea un juego de niños. Para utilizar el popular plugin (que tiene más de 2 millones de in­s­ta­la­cio­nes activas en todo el mundo) en tu página web de WordPress, instálalo primero a través del centro de in­s­ta­la­ción y co­n­fi­gu­ra­ción de plugins del sistema de gestión de co­n­te­ni­dos. Se­le­c­cio­na "Plugins" en el menú, a co­n­ti­nua­ción haz clic en "Instalar" e introduce "Google XML Sitemaps" en el campo de búsqueda. Al hacer clic en "Instalar ahora" se iniciará el proceso de in­s­ta­la­ción de la extensión, que debería aparecer en la parte superior de los re­su­l­ta­dos pre­se­n­ta­dos:

Los Google XML Sitemaps también pueden de­s­ca­r­gar­se ma­nua­l­me­n­te e in­s­ta­lar­se en el di­re­c­to­rio de plugins de tu in­s­ta­la­ción de WordPress. Si activas la extensión, puedes acceder a ella a través de "XML Sitemap" en el menú "Co­n­fi­gu­ra­ción". En co­m­pa­ra­ción con XML-Sitemaps.com, hay un número si­g­ni­fi­ca­ti­va­me­n­te mayor de opciones de co­n­fi­gu­ra­ción di­s­po­ni­bles en las si­guie­n­tes siete áreas:

  • Pa­ra­me­tri­za­cio­nes generales: aquí se definen los ajustes básicos y se determina, por ejemplo, si se debe informar au­to­má­ti­ca­me­n­te a Google y a Bing sobre los cambios o si se debe comprimir el sitemap au­to­má­ti­ca­me­n­te.
  • Páginas adi­cio­na­les: en esta sección puedes añadir archivos o URL que no pe­r­te­ne­cen a la página de WordPress, pero que se ejecutan en el mismo dominio.
  • Prioridad de las co­n­tri­bu­cio­nes: los ajustes en este menú son de pa­r­ti­cu­lar interés para los blogs y portales de noticias. Si trabajas con la etiqueta <priority> en el sitemap, define en este punto si el plugin debe calcular la prioridad de un mensaje y cómo hacerlo.
  • Contenido del mapa del sitio: utiliza este menú para se­le­c­cio­nar las ca­te­go­rías de páginas que se incluirán en el sitemap XML (por ejemplo, página de inicio, páginas estáticas, páginas de archivo, etc.).
  • Elementos excluidos: si deseas excluir ca­te­go­rías o mensajes in­di­vi­dua­les de la in­de­xa­ción, puedes hacerlo aquí.
  • Fre­cue­n­cias de cambio: Google XML Sitemaps ofrece la po­si­bi­li­dad de pree­s­ta­ble­cer la etiqueta <cha­n­ge­freq>. La fre­cue­n­cia de ac­tua­li­za­ción se puede ajustar incluso por separado para los di­fe­re­n­tes tipos de página.
  • Prio­ri­da­des: a co­n­ti­nua­ción, puedes realizar los mismos ajustes para el atributo <priority>.

Una vez hayas diseñado la co­n­fi­gu­ra­ción del sitemap según tus ne­ce­si­da­des, guarda los cambios rea­li­za­dos. Si haces clic en el enlace "Su mapa de sitio" después del proceso de guardado, enviarás tu sitemap XML a los ra­s­trea­do­res de los motores de búsqueda se­le­c­cio­na­dos.

Ir al menú principal