Qué es Soft 404: definición y guía completa SEO
Soft 404: Error que ocurre cuando una página devuelve un código HTTP 200 (OK) al servidor pero el contenido de la página indica que no existe o está vacío. Google detecta el contenido insuficiente o los mensajes de ‘página no encontrada’ y trata la URL como si fuera un error 404, aunque técnicamente responda con éxito.
Por qué se producen los soft 404 y cómo los detecta Google
Los soft 404 son especialmente frecuentes en ecommerce con productos descatalogados que siguen mostrando la página (con mensaje ‘producto no disponible’) devolviendo código 200, en sitios de búsqueda interna que muestran ‘0 resultados’ para queries sin resultados, en páginas de usuario que muestran contenido vacío si el perfil no existe, en sistemas de CMS que muestran una plantilla vacía cuando el contenido ha sido eliminado, y en páginas con muy poco contenido original rodeadas de navegación y elementos de plantilla. Google detecta los soft 404 comparando el contenido de la página con páginas similares del sitio y con patrones de ‘página no encontrada’.
Cómo diagnosticar y confirmar si una página es un soft 404
Google Search Console es la primera fuente: en el informe de Páginas bajo Indexación, la categoría ‘Excluidas’ incluye ‘Excluida por URL de error 404’ y ‘Excluida por soft 404’. Inspeccionar la URL específica en GSC muestra si Google la ha clasificado como soft 404 y el motivo. Complementariamente, la inspección manual de la página (ver el contenido visible, verificar el código HTTP con curl -I o con herramientas online) confirma el diagnóstico. Un test rápido: si el contenido de la página es principalmente navegación, footer y un mensaje de error, es muy probable que sea detectada como soft 404.
Cómo corregir un soft 404 según su origen
La corrección depende de la causa. Para productos descatalogados en ecommerce: si hay un producto sustituto, redirigir 301 a ese producto o a la categoría padre. Si el producto no tiene sustituto, devolver un 404 real (y mejor aún un 410 para acelerar la desindexación) o crear una página de producto archivado con contenido mínimo que explique la situación y sugiera alternativas. Para páginas de resultados de búsqueda interna sin resultados: añadir noindex en esas URLs o configurar el servidor para que devuelvan 404 en lugar de 200. Para plantillas vacías: implementar una verificación que devuelva 404 real cuando no haya contenido que mostrar.
Preguntas frecuentes
¿Un soft 404 puede perjudicar el posicionamiento de otras páginas del sitio?
De forma directa, no: un soft 404 individual solo afecta a esa URL. De forma indirecta, sí: si el sitio tiene miles de soft 404 (frecuente en ecommerces con muchos productos descatalogados), el crawl budget se desperdicia en URLs sin valor y la señal general de calidad del sitio puede verse afectada. Google también puede reducir la frecuencia de rastreo si detecta que muchas URLs visitadas no tienen contenido útil.
¿Cómo diferencio un soft 404 de thin content?
El thin content es una página con poco contenido original (aunque responde 200 y tiene algo de contenido). El soft 404 es una página donde el contenido implica que la URL no existe o está vacía. En la práctica, la diferencia es de grado: una página con 50 palabras genéricas sobre un producto inexistente podría ser tanto soft 404 como thin content. Google los trata de forma diferente: el soft 404 se excluye del índice por error, el thin content puede quedar indexado pero sin posicionar bien.