Cómo desindexar URLs en Google

Cuando queremos que nuestros contenidos sean enlazados desde los resultados de búsqueda nuestra primera obsesión es la de asegurarnos de la correcta indexación por parte de los motores de búsqueda. Esto es, que las arañas de Google sean capaces de acceder a nuestro contenido, interpretarlo e incluirlo en sus índices. Sin embargo, en ocasiones necesitamos hacer el proceso contrario, es decir: desindexar algunas URLs que Google ha encontrado e incluido en sus índices.

¿Por qué vamos a querer eliminar URLs de los índices de Google?

Puede haber diferentes motivos para querer que Google elimine una URL de nuestro sitio de sus índices:

Optimizar el «crawl budget»

Las arañas de Google le van a dedicar un tiempo finito a rastrear nuestra web. Obviamente vamos a preferir que durante ese tiempo se dedique a conocer aquellas páginas hacia las que queremos conseguir tráfico orgánico.

Si los indices de Google se llenan de URLs irrelevantes y los robots de Google se pasan el rato que nos visitan tratando de comprender esas URLs, estaremos malgastando el crawl budget asignado a nuestro sitio.

Esto es así, sobre todo, en sitios grandes en los que el número de las URLs es elevado y un gran porcentaje de URLs a desindexar puede realmente afectar el rendimiento de nuestro «presupuesto de rastreo».

En un pequeño blog esto no debería preocuparte especialmente, aunque puede haber otros motivos por los que quieras desindexar URLs de tu sitio.

Páginas con Thin Content

El Thin Content se produce cuando tenemos páginas con escaso contenido que realmente no aporta valor ni da una respuesta suficientemente completa a las posibles intenciones de búsqueda que trata de responder.

Esta es una «penalización algorítmica», es decir, que no es realmente una penalización, sino el efecto de aplicar el algoritmo. En concreto Panda.

Evidentemente la desindexación es la solución fácil, pero no siempre la más óptima. Si el tema que tratamos en esa página es realmente interesante para nuestro público objetivo, tal vez deberíamos plantearnos mejorar ese contenido para dar respuesta a esas consultas.

Pero si la cuestión a la que respondería ese posible contenido no es realmente interesante o simplemente no tiene un volumen suficiente que haga rentable el esfuerzo… pues entonces tal vez prefiramos desindexar esa URL para facilitar el rastreo de nuestro sitio web.

Desindexar URLs antiguas y/o desactualizadas

En otras ocasiones lo que pasa es que tenemos un contenido que, aunque tenía su sentido en el momento que lo publicamos, ha quedado desactualizado y ya no tiene razón de ser. Es lo que pasa con el contenido NO «evergreen», que si no tenemos uno más actual al que redirigirlo seguramente prefiramos desindexar su URL cuando quede obsoleto.

Desindexar URLs que generan contenido duplicado

Si dos URLs de nuestro sitio web incluyen contenido duplicado es posible que nos interese eliminar una de ellas.

Es cierto que tenemos la posibilidad de realizar un «Canonical» de una hacia la otra, pero en ocasiones nos convendrá eliminar una de ellas.

Desindexar otras URLs que no deberían estar ahí

URLs de prueba que nunca debimos publicar pero se hizo y google las indexó.

URLs propias de la plantilla de nuestro tema (de esas que se instalan de ejemplo). Estas pueden resultar muy útiles cuando configuramos el tema de la web, pero en ocasiones se generan páginas que al final no utilizaremos y que contienen textos provisionales, Lorem Ipsum o (peor aún) texto y enlaces sobre el propio tema.

En definitiva, cualquier URL que está indexada por error, pero simplemente no debería y no nos interesa que lo esté.

 Cómo podemos desindexar una URL de Google

Existen muchas formas de eliminar una URL de los índices de Google, pero unas funcionan y otras no lo hacen o son más lentas.

Retirar URLs en Search Console

Podemos retirar una URL de los indices de Google desde la propia herramienta Search Console.

Esta opción está en el apartado «Índice» bajo el nombre «Retirada de URL» y su utilización es realmente sencilla.

Retirar una URL del índice de Google desde Search Console

Entonces ¿por qué te digo que este método de desindexar URLs no funciona?

Pues porque en realidad no se elimina la URL. Simplemente se «retira» temporalmente de los índices.

Pasados 6 meses, si Google accede a la URL desde cualquier sitio (un sitemap, un enlace,…) puede volver a indexarla. Así que puede que si solo utilizas esta retirada en unos meses sufras un dejavú y vuelvas a encontrarte la URL dichosa en las SERPs.

Esta retirada temporal puede ser útil si sabemos que esa URL la vamos a retirar, pero la implementación de esta eliminación nos va a llevar tiempo. Esta retirada nos da tiempo para que, cuando las arañas de Google rastreen de nuevo el sitio web, ya no encuentren esa página ahí disponible para ser indexada.

En este vídeo se explica como realizar esta retirada de una URL desde la Consola de Google.

Eliminar una URL con una redirección 301

Redireccionar una URL con una redirección de este tipo tiene una gran ventaja: mantenemos el PageRank de la página eliminada traspasándole su autoridad a la nueva página a la que apuntamos esa URL.

Si la página simplemente va a desaparecer: 410 o 404

Estas dos respuestas indicarán a google que el contenido ya no está (410) o que el contenido no se ha encontrado (404)

El primer caso será más directo, pues le indicamos a Google que ese contenido ya no estará allí más.

En el segundo caso, Google verá que rastreo tras rastreo no puede acceder a la web porque se le devuelve un código 404 de página no encontrada y finalmente dejará de considerarla válida para ser indexable.

Utilizando la etiqueta «NOINDEX»

En algunas ocasiones podemos considerar que una página debe ser accesible por los usuarios cuando navegan por nuestro sitio web, pero aún así no tiene sentido que alguien acceda a ellas desde una búsqueda.

Por ejemplo, la política de privacidad, el aviso legal, la política de cookies,… es información que, aunque debe de ser accesible por los usuarios de nuestro sitio web no tiene sentido pensar que respondan a ninguna intención de búsqueda.

En este caso simplemente deberás añadir esta etiqueta a la secciónde tu página.

 

Este método funciona muy bien cuando la etiqueta la añades antes de que Google haya rastreado esa URL. Después, la verdad, es que te va a costar más que Google la interprete correctamente.

Desindexar contenido en otros sitios web

¿Y si el contenido que necesitamos eliminar no lo hemos publicado nosotros y no podemos gestionarlo?

Ya no se trata de crawl budget o de SEO, pero nuestro nombre o nuestra marca se puede ver afectado por contenidos publicados en otros sitios. Es posible que se publique contenido ofensivo, que vulnera nuestra intimidad o que infringe derechos de autor.

Entonces, la única forma de eliminarlo de Google es solicitándoselo al propio Google.

Afortunadamente Google nos facilita las herramientas necesarias para solicitar esta eliminación.

Si se trata de contenido ofensivo podremos solicitar su revisión y eliminación en un simple formulario que podremos encontrar aquí

 

Formulario para denunciar contenido inadecuado en Google

Si en cambio, el problema es de tipo legal sobre contenidos encontrados en cualquiera de los productos de Google podrás presentar tu solicitud de eliminación en esta otra página desde la que podrás solicitar la retirada del contenido.

 

Retirar contenido de Google

Parece que Google se toma muy en serio la revisión de todas estas solicitudes, por lo que seguramente te harán caso y, si corresponde, tomarán las medias oportunas.

Y tú ¿eliminas las URLs que sobran en tu web o las dejas agonizar mientras estropean los esfuerzos de tu SEO?

Sobre el autor

Deja un comentario