Cuando varias URL presentan el mismo contenido o contenido muy similar, se considera que existe contenido duplicado. Esta situación puede impactar ne­ga­ti­va­me­n­te en la in­de­xa­ción de las URL im­pli­ca­das. Para aquellos proyectos que ofrecen co­n­te­ni­dos muy parecidos, gestionar el contenido duplicado supone un desafío. Una posible solución para este problema es la llamada canonical tag, con la que se puede declarar una dirección URL o URI como versión principal del contenido para la in­de­xa­ción.

¿Qué es una canonical tag?

En 2009, Yahoo, Microsoft y Google in­tro­du­je­ron la etiqueta canónica o canonical tag para enlaces, la cual se co­n­ve­r­ti­ría en una de las he­rra­mie­n­tas para el SEO más im­po­r­ta­n­tes. Desde 2012, es co­n­si­de­ra­da un estándar web oficial según la norma RFC 6596. Cuando se integra un enlace canónico en una página web, el enlace apunta a una dirección URL o URI que funciona como URL canónica, la cual reemplaza a la página web como re­fe­re­n­cia para la in­de­xa­ción.

Una URL canónica aúna su propia repu­tación y la de las páginas a las que enlaza, lo que le permite obtener un mejor po­si­cio­na­mie­n­to en los motores de búsqueda. Además, como las di­re­c­cio­nes enlazadas no se in­co­r­po­ran al índice de in­de­xa­ción, no surgen problemas de contenido duplicado. No obstante, esta in­di­ca­ción actúa solo como re­co­me­n­da­ción para los motores de búsquedas, que no tienen por qué registrar el atributo “link” ni incluirlo en la va­lo­ra­ción. Si no se im­ple­me­n­ta co­rre­c­ta­me­n­te, existe el riesgo de que la página sea ignorada por completo, por lo que es crucial prestar atención al uti­li­zar­la.

¿Cómo funciona una canonical tag?

Para que la etiqueta canónica funcione co­rre­c­ta­me­n­te, se requieren dos elementos ese­n­cia­les. Por un lado, es necesaria la URL exacta de la página canónica deseada, la cual se considera la versión principal del contenido. Por otro lado, se necesita un elemento “link” en el que se incluya la etiqueta y la URL canónica. El código que se muestra es un ejemplo para una canonical tag:

<link rel="canonical" href="URL/URI de la página canónica ">
html

El elemento “link”, que en HTML no tiene una etiqueta de cierre, contiene solo los atributos rel y href. El primero es necesario para es­pe­ci­fi­car la relación entre el documento actual y el enlazado, mientras que href indica dónde se encuentra el documento enlazado. Los valores re­que­ri­dos a tales efectos aparecen en­tre­co­mi­lla­dos: el valor rel “canonical” determina que el enlace es una dirección URL canónica, la cual se indica a co­n­ti­nua­ción en el atributo href.

Para que las páginas al­te­r­na­ti­vas solo hagan re­fe­re­n­cia a la versión principal es­pe­ci­fi­ca­da, el código debe in­te­grar­se en la cabecera de los do­cu­me­n­tos HTML co­rre­s­po­n­die­n­tes. Pero, incluso si el contenido no está di­s­po­ni­ble en HTML, como, por ejemplo, en el caso de archivos PDF, también es posible im­ple­me­n­tar una etiqueta canónica en la cabecera HTTP. En este caso se utiliza la siguiente sintaxis:

Link: <URL/URI de la página canónica>; rel="canonical"
html

¿Cuándo se deben usar las canonical tags?

Por de­fi­ni­ción, las etiquetas canónicas no son un factor que los motores de búsqueda tengan ne­ce­sa­ria­me­n­te en cuenta. Dado que el código debe ser im­ple­me­n­ta­do in­di­vi­dua­l­me­n­te para cada contenido duplicado y URI al­te­r­na­ti­va, se plantea la pregunta de si el esfuerzo de gestión asociado, re­la­ti­va­me­n­te elevado, resulta rentable. A co­n­ti­nua­ción, te mostramos ejemplos de si­tua­cio­nes en las que conviene co­n­si­de­rar la uti­li­za­ción de este tipo de etiquetas.

El contenido se reparte en varias di­re­c­cio­nes URL dinámicas

Las URL dinámicas de­sem­pe­ñan hoy en día un papel muy im­po­r­ta­n­te, sobre todo en el ámbito del comercio ele­c­tró­ni­co. Las páginas pe­r­so­na­li­za­das co­n­s­ti­tu­yen cie­r­ta­me­n­te una opción excelente y sencilla para presentar el mismo contenido (con ligeras va­ria­cio­nes) a usuarios di­fe­re­n­tes, pero también causan problemas a los crawlers de los motores de búsqueda. Las canonical tags son, en este sentido, más que re­co­me­n­da­bles para evitar la posible cla­si­fi­ca­ción de contenido duplicado.

Se puede acceder al mismo contenido con di­fe­re­n­tes URL

En lo que respecta a la es­tru­c­tu­ra, algunos proyectos web, como blogs, tiendas virtuales o guías digitales, ofrecen co­n­te­ni­dos di­s­tri­bui­dos si­mu­l­tá­nea­me­n­te en di­fe­re­n­tes ca­te­go­rías y a menudo también en di­fe­re­n­tes URL. Así, una tienda podría redirigir, por ejemplo, a la página general del artículo “camisa verde” bajo las si­guie­n­tes di­re­c­cio­nes URL:

  • mi-tienda.shop/moda/camisa-verde
  • mi-tienda.shop/modadeverano/camisa-verde
  • mi-tienda.shop/modadeinvierno/camisa-verde

El hecho de que los co­n­te­ni­dos estén di­s­po­ni­bles bajo di­fe­re­n­tes URL es frecuente cuando se han mo­di­fi­ca­do las es­tru­c­tu­ras de una página web o se ha tra­s­la­da­do un dominio completo. En estos casos, las re­di­re­c­cio­nes 301 son una buena opción, pero si no se puede llevar a cabo té­c­ni­ca­me­n­te, entonces el elemento link rel=“canonical” se erige como una buena al­te­r­na­ti­va.

El mismo contenido está di­s­po­ni­ble en dominios di­fe­re­n­tes

La etiqueta canónica también se puede usar con dominios externos. El pro­ce­di­mie­n­to es el mismo que en los dominios internos, por lo que también se debe pro­po­r­cio­nar una URL exacta como versión principal. De este modo, puedes ofrecer tu contenido en otro dominio sin generar contenido duplicado. Con este método, también se traspasan los factores re­le­va­n­tes para el SEO a la URL principal, lo que puede mejorar si­g­ni­fi­ca­ti­va­me­n­te su re­n­di­mie­n­to.

Los co­n­te­ni­dos tienen formatos di­fe­re­n­tes

En algunas si­tua­cio­nes, resulta si­g­ni­fi­ca­ti­vo publicar contenido en di­fe­re­n­tes formatos y no ofrecer solo, por ejemplo, un fo­r­mu­la­rio en versión HTML, sino también como archivo PDF y en versión para imprimir. En este sentido se re­co­mie­n­da usar la etiqueta canonical para que los motores de búsqueda no tengan que evaluar cada una de las variantes por separado y terminen cla­si­fi­ca­n­do la equi­vo­ca­da.

Consejo

Si se dispone de un ce­r­ti­fi­ca­do SSL/TLS válido, es re­co­me­n­da­ble convertir las di­re­c­cio­nes URL con HTTPS en canónicas y re­di­re­c­cio­nar las variantes no seguras (HTTP) a estas. Lo mismo se aplica a las páginas móviles o AMP, en cuyo caso las canonical tags son incluso obli­ga­to­rias.

Canonical tag: errores comunes

Una URL canónica es en muchas si­tua­cio­nes la mejor opción para evitar el contenido duplicado. Los motores de búsqueda más im­po­r­ta­n­tes tienen en cuenta el elemento canonical en la in­de­xa­ción y reconocen que la web no tiene intención de po­si­cio­nar­se de manera paralela con contenido repetido. Además, las señales positivas de los bu­s­ca­do­res se reúnen en la URL principal, lo que mejora las opciones de po­si­cio­na­mie­n­to. En este punto, no obstante, ha de hacerse hincapié en la po­si­bi­li­dad de que el empleo de canonical tags pueda co­n­ve­r­ti­r­se en un factor negativo si estas no se aplican co­rre­c­ta­me­n­te. En los párrafos si­guie­n­tes te mostramos los errores “canónicos” más comunes.

Consejo

Con la he­rra­mie­n­ta de análisis SEO de IONOS, puedes comprobar sin coste y con gran facilidad el re­n­di­mie­n­to de tu página web.

Las páginas numeradas remiten a una URL canónica

Para elaborar contenido atractivo, muchos we­b­ma­s­te­rs recurren a la pa­gi­na­ción. Son sobre todo los portales de noticias los que utilizan este método, en el que el contenido se numera y divide en varias páginas. Si para ello se emplean las etiquetas canónicas y se hace re­fe­re­n­cia a páginas po­s­te­rio­res que remitan a la dirección de salida con el link-rel="canonical", se está in­cu­rrie­n­do en un error grave, porque las si­guie­n­tes páginas no serían un duplicado, sino que al­be­r­ga­rían contenido único que no se re­gi­s­tra­ría en el índice. Para informar a los bu­s­ca­do­res sobre la pa­gi­na­ción escogida, puedes optar por dos pro­ce­di­mie­n­tos:

  • En cada URL se hace re­fe­re­n­cia tanto a la página anterior como a la posterior, para lo que es necesario el atributo rel y para lo que también hay que re­em­pla­zar el valor "canonical" por "prev" o "next".
  • Con link-rel="canonical" se remite a una versión uni­la­te­ral del contenido co­rre­s­po­n­die­n­te que aúna todas las webs paginadas.

Las di­re­c­cio­nes URL relativas no enlazan a la página canónica deseada

Como la mayoría de etiquetas de HTML, <link> ofrece la po­si­bi­li­dad de indicar di­re­c­cio­nes URL absolutas y relativas. Mientras que las absolutas describen toda la ruta (incluido “https://”, etc.), las relativas aluden es­pe­cí­fi­ca­me­n­te a una carpeta de­te­r­mi­na­da en la página web actual sin que para ello sea necesario indicar la dirección URL completa. Así, la ruta “imágenes/imagen.jpg” indica, por ejemplo, que la imagen “imagen.jpg” está ubicada en la su­b­ca­r­pe­ta “imágenes” del di­re­c­to­rio actual. La uti­li­za­ción de tales rutas al hacer uso de la etiqueta canonical tag da lugar a co­m­pli­ca­cio­nes, de modo que, en el peor de los casos, los crawlers la ignoran co­m­ple­ta­me­n­te.

Para eje­m­pli­fi­car lo arriba expuesto, se utiliza el siguiente ejemplo como guía:

< link rel="canonical" href="example.com/cupcake.html" >
html

Debido a la ausencia del prefijo HTTP, el crawler valora la dirección example.com/cupcake.html como URL relativa y asume que http://example.com/example.com/cupcake.html es la URL canónica. Para evitar su­po­si­cio­nes, es co­n­ve­nie­n­te indicar la URL canónica completa o recurrir a una URL absoluta sin dominio:

< link rel="canonical" href="/cupcake.html" />
html
Consejo

Aplicar de forma in­co­rre­c­ta una es­tra­te­gia SEO puede tener graves co­n­se­cue­n­cias en la cla­si­fi­ca­ción de una página web en bu­s­ca­do­res. Descubre los errores SEO más comunes para que no caigas en ellos.

Las páginas hacen re­fe­re­n­cia a más de una URL canónica

La na­tu­ra­le­za misma de las URL canónicas descarta que una página se­cu­n­da­ria pueda hacer re­fe­re­n­cia a varias páginas co­n­si­de­ra­das como versiones pri­n­ci­pa­les. No obstante, este tipo de enlaces múltiples pueden aparecer fá­ci­l­me­n­te al trabajar con un sistema de gestión de co­n­te­ni­dos o con un software para tiendas. A menudo, los plugins y las pla­n­ti­llas colocan canonical tags de manera au­to­má­ti­ca, a pesar de haber indicado la presencia de una canonical URL. Sobre todo, al utilizar este tipo de plugins, pero también en el caso de los cambios en la es­tru­c­tu­ra de las páginas, se debe verificar el texto fuente y corregir los datos si fuera necesario. De lo contrario, todo esfuerzo será en vano, ya que lo más probable es que los motores de búsqueda ignoren todos las canonical tags en lugar de decidirse por una.

Las canonical tags no aparecen en la versión móvil

Cuando, además de la versión de es­cri­to­rio, se ofrece una versión móvil de una página web, puede que se tenga que hacer frente a varios errores. Asimismo, aun cuando las páginas móviles se indexan a pesar de la exi­s­te­n­cia de errores, se debe asistir a los motores de búsqueda en lo que respecta al registro y la ca­te­go­ri­za­ción. Así, Google re­co­mie­n­da destacar los homólogos móviles como versión al­te­r­na­ti­va mediante el elemento rel=“alternate” y que las páginas móviles remitan por canonical tag a las co­rre­s­po­n­die­n­tes URL de es­cri­to­rio. En la página web de Google De­ve­lo­pe­rs puedes encontrar más consejos e in­fo­r­ma­ción en una guía para páginas web móviles.

Consejo

Dentro del SEO hay muchos aspectos que tener en cuenta: co­m­po­ne­n­tes de una página web, es­tra­te­gias de op­ti­mi­za­ción, términos técnicos, etc. Por eso, quienes acaban de empezar con el po­si­cio­na­mie­n­to en bu­s­ca­do­res, pueden encontrar co­m­pli­ca­do entender el concepto. En nuestro artículo “SEO de la A a la Z” te enseñamos los términos re­la­cio­na­dos más im­po­r­ta­n­tes

Co­n­tra­di­c­cio­nes entre las canonical tags y el hreflang

Los proyectos web in­te­r­na­cio­na­les con di­fe­re­n­tes dominios geo­grá­fi­cos plantean un gran reto a los es­pe­cia­li­s­tas en SEO. Por un lado, las páginas de todos los dominios deben lograr un buen po­si­cio­na­mie­n­to y llegar a los usuarios correctos. Por otro, hay que reducir el riesgo del contenido duplicado al mínimo. Una de la he­rra­mie­n­tas más im­po­r­ta­n­tes a este respecto es el atributo hreflang, pues sirve de ayuda para que las páginas in­di­vi­dua­les de cada dominio sean co­n­si­de­ra­das como al­te­r­na­ti­vas equi­va­le­n­tes. Pero, para que el atributo funcione, es im­po­r­ta­n­te que cada página enlace a sí misma y a las otras versiones. Si estas URL también remiten a una canonical URL por medio de una canonical tag, los crawlers de los motores de búsqueda se en­cue­n­tran ante una co­n­tra­di­c­ción. El resultado es que los motores de búsqueda ignoran dichas señales e indexan las páginas web en función de otras ca­ra­c­te­rí­s­ti­cas, por lo que se debe evitar, así, el uso conjunto de ambas in­s­tru­c­cio­nes.

Hecho

La co­m­bi­na­ción de URL canónicas y del atributo hreflang no es el único factor que genera co­n­tra­di­c­cio­nes negativas para el ranking de las páginas web, sino que Google también rechaza el uso co­m­pa­r­ti­do de canonical tags y de in­s­tru­c­cio­nes como nofollow, noindex o disallow.

Di­fe­re­n­cias entre canonical tag y re­di­re­c­cio­na­mie­n­to 301

La etiqueta canónica y las re­di­re­c­cio­nes 301 tienen si­mi­li­tu­des en su función de indicar a los motores de búsqueda que co­n­si­de­ren varias páginas como una sola versión. No obstante, mientras los re­di­re­c­cio­na­mie­n­tos 301, basados en el código de estado 301 de HTTP (Moved Pe­r­ma­ne­ntly), dirigen a los motores de búsqueda y a los vi­si­ta­n­tes hacia una URL principal y suprimen el resto de variantes; las páginas que contienen la etiqueta canónica son vistas como copias por los motores de búsqueda, pero pe­r­ma­ne­cen di­s­po­ni­bles para los vi­si­ta­n­tes.

Otra de las di­fe­re­n­cias estriba en el hecho de que los motores de búsqueda nunca ignoran un re­di­re­c­cio­na­mie­n­to, lo que sí puede ocurrir con el elemento “link” re­co­me­n­da­do. Ambos métodos se di­fe­re­n­cian, por último, en cuanto a su fu­n­cio­na­li­dad con respecto al uso de los dominios: mientras que los re­di­re­c­cio­na­mie­n­tos 301 trasladan un contenido de un dominio a otro, la etiqueta canónica señala que una página del dominio A tiene un equi­va­le­n­te en el dominio B.

Ir al menú principal