Wiki SEO

Qué es Noindex: definición y guía completa SEO

Noindex: Directiva que indica a los motores de búsqueda que no incluyan una página en su índice. Puede implementarse como meta robots en el HTML (<meta name=’robots’ content=’noindex’>) o como cabecera HTTP X-Robots-Tag. Es la forma más directa y fiable de impedir que una página aparezca en los resultados de búsqueda.

Métodos de implementación del noindex y cuándo usar cada uno

El método principal es la etiqueta meta robots en el head del HTML: <meta name=’robots’ content=’noindex’>. Es la forma más universal y funciona con todos los buscadores. La cabecera HTTP X-Robots-Tag: noindex es el equivalente para recursos no-HTML (PDFs, imágenes, vídeos) y se configura en el servidor web. En WordPress, plugins como Yoast SEO o RankMath permiten activar noindex por página, categoría o tipo de contenido completo desde el panel de administración. El noindex a nivel de directiva HTTP es útil cuando no se tiene control sobre el HTML (por ejemplo, en páginas generadas por plataformas de terceros).

Qué páginas deberías noindexar en tu sitio

Las páginas de administración y login (/wp-admin/, /account/, /checkout/) no deben indexarse nunca. Las páginas de agradecimiento post-formulario o post-compra no aportan valor SEO y deben tener noindex. Las páginas de paginación profunda (página 10, 20, 30 de un blog o catálogo) generan poco valor SEO y diluyen la autoridad: noindex es una opción válida aunque el debate sobre paginación es complejo. Las páginas de resultados de búsqueda interna del sitio son casi siempre thin content y deben tener noindex. Las páginas de etiquetas o de autor en WordPress con pocas entradas generan duplicados de escaso valor. Las páginas de política de privacidad y aviso legal no tienen valor SEO y pueden noindexarse sin consecuencias.

El error crítico: noindex con bloqueo en robots.txt

El error más grave relacionado con noindex es combinar noindex en el HTML con bloqueo en robots.txt para la misma URL. Googlebot no puede acceder a la página porque robots.txt lo bloquea, por tanto no puede leer el noindex, y si la URL tiene backlinks externos, Google puede indexarla de todas formas con un snippet basado en los anchor texts de los enlaces entrantes. La consecuencia: la URL aparece en los resultados sin contenido visible (‘La descripción de este resultado no está disponible por el archivo robots.txt’). La solución: para páginas que no deben indexarse, permitir el rastreo en robots.txt y usar noindex en el HTML.

Preguntas frecuentes

¿Cuánto tarda Google en eliminar del índice una página a la que añado noindex?

Google debe rastrear la página para detectar el noindex y entonces eliminarla del índice. El proceso puede tardar días o semanas dependiendo de la frecuencia de rastreo del dominio. Para acelerar el proceso, se puede solicitar la eliminación temporal usando la herramienta ‘Eliminaciones’ de GSC, aunque esta es una solución provisional (caduca a los 6 meses) y el noindex en el HTML es la solución definitiva.

¿Noindex y nofollow deben ir siempre juntos?

No necesariamente. Noindex impide que la página aparezca en los resultados, pero los enlaces de esa página pueden seguir transmitiendo PageRank (si no añades nofollow). En páginas de paginación que noindexas, puede ser útil mantener follow para que Googlebot descubra y siga los enlaces a los artículos. En páginas de login o administración que noindexas, añadir también nofollow tiene sentido para no transmitir señales desde esas URLs.