¿Cuando usar el canonical y el noindex? ¿Es bueno que estén juntos? ¿Es malo? Bueno, te damos nuestra opinión y te mostramos nuestras pruebas para que tu decidas ¿No tienes ganas de leer las pruebas? Ok, click aquí si eres TL;DR.
Las directivas canonicals y noindex
En Señor Muñoz llevamos desde hace un tiempo realizando una serie de tests para ver si realmente Google interpreta ciertas directivas tal y como dice que lo hace. Para ello, la primera directiva en la que pusimos el ojo fue la directiva canonical.
Canonical
Veamos primero lo que dice Google sobre la etiqueta rel=canonical.
En 2009, Google anunciaba el soporte de la etiqueta rel=canonical, destinada a solucionar los problemas de contenido duplicado, ya que permitía relacionar las páginas que eran versiones duplicadas con su versión original o canónica. En el post donde se hace este anuncio se puede leer lo siguiente:
¿Es el rel=”canonical” una recomendación o una directiva?
Es una recomendación que apoyamos firmemente. Tomamos en cuenta tu preferencia junto con otras señales cuando calculamos la páginas más relevantes que se muestran en los resultados de búsqueda.
Es decir, Google afirma que aunque considera esta etiqueta una señal muy fuerte y la apoya bastante, no siempre tiene porqué seguir su indicación.
De hecho, en un artículo publicado en 2013 en el mismo blog, Google dice lo siguiente (negritas nuestras):
Implementando el elemento con el atributo rel = canonical en tu sitio web proporciona una fuerte señal a los motores de búsqueda para indicar cual es la versión preferida para ser indexada entre varias páginas duplicadas en tu sitio web. […] El elemento con el atributo rel = canonical consolida propiedades de indexación de los elementos duplicados, como tus enlaces entrantes, así como especifica la URL preferida en los resultados de búsqueda.
De nuevo viene a incidir en la fuerza de la etiqueta rel=canonical a la hora de indicar a los motores de búsqueda cómo interpretar el contenido duplicado marcado con dicha etiqueta, pero en ningún momento afirma que su cumplimiento sea obligatorio.
El que nos planteásemos este test vino por la experiencia de haber comprobado cómo en, según qué ocasiones, Google efectivamente respetaba esta directiva para unos casos y la pasaba por alto para otros.
Los experimentos y por qué comprobarlos con el noindex
En varias ocasiones nos hemos encontrado con la recomendación por parte de Google de no poner la etiqueta rel=”canonical” en aquellas páginas que además estén marcadas como noindex.
Sin embargo, podemos encontrar multitud de páginas marcadas como noindex que presentan el canonical apuntando a sí mismas.
En un hangout de Webmasters de Google tuvimos la oportunidad de preguntar directamente a John Mueller sobre el tema y su respuesta fue precisamente esa misma recomendación, lo mismo que en su día ya recomendó también Matt Cutts.
En principio tiene lógica: si una página no queremos que se indexe, para lo cual añadimos un meta robots noindex, no tiene sentido que por otro indiquemos a Google que considere esa página como canónica para ningún caso.
A partir de esto, quisimos comprobar de qué manera se comporta Google ante una página que presenta tanto un canonical apuntando a sí misma como una etiqueta meta robots noindex. Para ello hicimos dos tests distintos:
- en el primer test, a unas landings que hacían canonical a sí mismas y que estaban indexadas en Google les añadimos la etiqueta meta robots con noindex.
- En el segundo, creamos las landings directamente con ambas etiquetas antes de ponerlas online.
A continuación desarrollamos un poco más cada uno de los experimentos.
Experimento 1: landings con canonicals a si mismos y ya indexadas a las que le añadíamos noindex
Metodología y desarrollo del experimento
Creamos cuatro URLs distintas, cada una luchando por keywords distintas. A todas ellas les añadimos la etiqueta rel canonical apuntando a sí mismas y dejamos que Google las indexara.
Una vez nos aseguramos que las cuatro URLs estaban indexadas, procedimos a añadirle la etiqueta meta robots noindex, en dos de ellas después del canonical, y en las otras dos antes. Una vez hecho esto pasamos las cuatro URLs por ‘Explorar como Google’ de Search Console. Desde entonces hasta ahora, las cuatro URLs continúan indexadas.
Primer paso:
URL | 1º |
URL A | canonical a sí misma |
URL B | canonical a sí misma |
URL C | canonical a sí misma |
URL D | canonical a sí misma |
Segundo paso: tras primera indexación
URL | 1º | 2º |
URL A | canonical a sí misma | meta robot noindex, nofollow |
URL B | canonical a sí misma | meta robots noindex, follow |
URL C | meta robot noindex, nofollow | canonical a sí misma |
URL D | meta robots noindex, follow | canonical a sí misma |
Experimento 2: landings directamente con ambas etiquetas antes de ponerlas online
En este caso creamos también otras 4 URLs, solo que esta vez les añadimos directamente tanto el canonical como el noindex, cambiando el orden de las mismas de modo que en dos de ellas apareciera antes el canonical y en las otras dos el noindex. Desde entonces hasta ahora, ninguna de ellas se ha indexado.
URL | 1º | 2º |
URL E | canonical a sí misma | meta robot noindex, nofollow |
URL F | canonical a sí misma | meta robots noindex, follow |
URL G | meta robot noindex, nofollow | canonical a sí misma |
URL H | meta robots noindex, follow | canonical a sí misma |
Resumiendo:
Como podemos ver por los dos experimentos realizados, las URLs que inicialmente hacían canonical a sí mismas y a las que posteriormente se les añadió un noindex continúan indexadas (Es decir, Google no ha respetado la etiqueta meta robots). Sin embargo, aquellas URLs a las que se se les ha puesto desde un principio tanto el canonical a sí mismas como el noindex, no se han indexado en ningún momento (es decir, Google ha respetado el meta robots):
URL | Índice de Google |
URL A | indexada |
URL B | indexada |
URL C | indexada |
URL D | indexada |
URL E | no indexada |
URL F | no indexada |
URL G | no indexada |
URL H | no indexada |
- Si una URL, al ser rastreada por primera vez, presenta las etiquetas canonical y noindex, Google respeta el noindex.
- Si una URL, al ser rastreada por primera vez, presenta el canonical, y posteriormente se le añade el noindex, Google mantiene la URL indexada a pesar del noindex. En las URLs de nuestro experimento, si accedemos a la caché de Google, podemos ver que en el código fuente presenta el noindex (ocultamos los datos para evitar que nadie desvirtue el experimento enlazando a la landing de ejemplo)
Conclusión:
Dependiendo del momento en que combinemos canonical y noindex, Google respetará una u otra, por lo que si queremos asegurarnos de que Google desindexe una URL que ya teníamos indexada, lo mejor es quitarle el canonical (si lo tiene) y marcarla con noindex.
SIGUE LEYENDO…
Ir a la fuente / Author: Sergio Redondo
La difusión de estos contenidos se realiza bajo una premisa informativa y educacional. Todos los derechos sobre los contenidos pertenecen a sus autores que permiten su difusión bajo licencia CC.
VEO lo que NO SE VEPosicionamiento SEO, Hosting Servidores SSD optimizados para WordPress, Diseño de páginas web WordPress Primer ANÁLISIS SEO GRATIS! Envía un email con tu dominio a: |