Cuando queremos que nuestros contenidos sean enlazados desde los resultados de b√ļsqueda nuestra primera obsesi√≥n es la de asegurarnos de la correcta indexaci√≥n por parte de los motores de b√ļsqueda. Esto es, que las ara√Īas de Google sean capaces de acceder a nuestro contenido, interpretarlo e incluirlo en sus √≠ndices. Sin embargo, en ocasiones necesitamos hacer el proceso contrario, es decir: desindexar algunas URLs que Google ha encontrado e incluido en sus √≠ndices.

¬ŅPor qu√© vamos a querer eliminar URLs de los √≠ndices de Google?

Puede haber diferentes motivos para querer que Google elimine una URL de nuestro sitio de sus índices:

Optimizar el ‚Äúcrawl budget‚ÄĚ

Las ara√Īas de Google le van a dedicar un tiempo finito a rastrear nuestra web. Obviamente vamos a preferir que durante ese tiempo se dedique a conocer aquellas p√°ginas hacia las que queremos conseguir tr√°fico org√°nico.

Si los indices de Google se llenan de URLs irrelevantes y los robots de Google se pasan el rato que nos visitan tratando de comprender esas URLs, estaremos malgastando el crawl budget asignado a nuestro sitio.

Esto es as√≠, sobre todo, en sitios grandes en los que el n√ļmero de las URLs es elevado y un gran porcentaje de URLs a desindexar puede realmente afectar el rendimiento de nuestro ‚Äúpresupuesto de rastreo‚ÄĚ.

En un peque√Īo blog esto no deber√≠a preocuparte especialmente, aunque puede haber otros motivos por los que quieras desindexar URLs de tu sitio.

P√°ginas con Thin Content

El Thin Content se produce cuando tenemos p√°ginas con escaso contenido que realmente no aporta valor ni da una respuesta suficientemente completa a las posibles intenciones de b√ļsqueda que trata de responder.

Esta es una ‚Äúpenalizaci√≥n algor√≠tmica‚ÄĚ, es decir, que no es realmente una penalizaci√≥n, sino el efecto de aplicar el algoritmo. En concreto Panda.

Evidentemente la desindexaci√≥n es la soluci√≥n f√°cil, pero no siempre la m√°s √≥ptima. Si el tema que tratamos en esa p√°gina es realmente interesante para nuestro p√ļblico objetivo, tal vez deber√≠amos plantearnos mejorar ese contenido para dar respuesta a esas consultas.

Pero si la cuestión a la que respondería ese posible contenido no es realmente interesante o simplemente no tiene un volumen suficiente que haga rentable el esfuerzo… pues entonces tal vez prefiramos desindexar esa URL para facilitar el rastreo de nuestro sitio web.

Desindexar URLs antiguas y/o desactualizadas

En otras ocasiones lo que pasa es que tenemos un contenido que, aunque ten√≠a su sentido en el momento que lo publicamos, ha quedado desactualizado y ya no tiene raz√≥n de ser. Es lo que pasa con el contenido NO ‚Äúevergreen‚ÄĚ, que si no tenemos uno m√°s actual al que redirigirlo seguramente prefiramos desindexar su URL cuando quede obsoleto.

Desindexar URLs que generan contenido duplicado

Si dos URLs de nuestro sitio web incluyen contenido duplicado es posible que nos interese eliminar una de ellas.

Es cierto que tenemos la posibilidad de realizar un ‚ÄúCanonical‚ÄĚ de una hacia la otra, pero en ocasiones nos convendr√° eliminar una de ellas.

Desindexar otras URLs que no deberían estar ahí

URLs de prueba que nunca debimos publicar pero se hizo y google las indexó.

URLs propias de la plantilla de nuestro tema (de esas que se instalan de ejemplo). Estas pueden resultar muy √ļtiles cuando configuramos el tema de la web, pero en ocasiones se generan p√°ginas que al final no utilizaremos y que contienen textos provisionales, Lorem Ipsum o (peor a√ļn) texto y enlaces sobre el propio tema.

En definitiva, cualquier URL que está indexada por error, pero simplemente no debería y no nos interesa que lo esté.

 Cómo podemos desindexar una URL de Google

Existen muchas formas de eliminar una URL de los índices de Google, pero unas funcionan y otras no lo hacen o son más lentas.

Retirar URLs en Search Console

Podemos retirar una URL de los indices de Google desde la propia herramienta Search Console.

Esta opci√≥n est√° en el apartado ‚Äú√ćndice‚ÄĚ bajo el nombre ‚ÄúRetirada de URL‚ÄĚ y su utilizaci√≥n es realmente sencilla.

Retirar una URL del índice de Google desde Search Console

Entonces ¬Ņpor qu√© te digo que este m√©todo de desindexar URLs no funciona?

Pues porque en realidad no se elimina la URL. Simplemente se ‚Äúretira‚ÄĚ temporalmente de los √≠ndices.

Pasados 6 meses, si Google accede a la URL desde cualquier sitio (un sitemap, un enlace,‚Ķ) puede volver a indexarla. As√≠ que puede que si solo utilizas esta retirada en unos meses sufras un dejav√ļ y vuelvas a encontrarte la URL dichosa en las SERPs.

Esta retirada temporal puede ser √ļtil si sabemos que esa URL la vamos a retirar, pero la implementaci√≥n de esta eliminaci√≥n nos va a llevar tiempo. Esta retirada nos da tiempo para que, cuando las ara√Īas de Google rastreen de nuevo el sitio web, ya no encuentren esa p√°gina ah√≠ disponible para ser indexada.

En este vídeo se explica como realizar esta retirada de una URL desde la Consola de Google.

Eliminar una URL con una redirección 301

Redireccionar una URL con una redirección de este tipo tiene una gran ventaja: mantenemos el PageRank de la página eliminada traspasándole su autoridad a la nueva página a la que apuntamos esa URL.

Si la p√°gina simplemente va a desaparecer: 410 o 404

Estas dos respuestas indicar√°n a google que el contenido ya no est√° (410) o que el contenido no se ha encontrado (404)

El primer caso será más directo, pues le indicamos a Google que ese contenido ya no estará allí más.

En el segundo caso, Google verá que rastreo tras rastreo no puede acceder a la web porque se le devuelve un código 404 de página no encontrada y finalmente dejará de considerarla válida para ser indexable.

Utilizando la etiqueta ‚ÄúNOINDEX‚ÄĚ

En algunas ocasiones podemos considerar que una p√°gina debe ser accesible por los usuarios cuando navegan por nuestro sitio web, pero a√ļn as√≠ no tiene sentido que alguien acceda a ellas desde una b√ļsqueda.

Por ejemplo, la pol√≠tica de privacidad, el aviso legal, la pol√≠tica de cookies,‚Ķ es informaci√≥n que, aunque debe de ser accesible por los usuarios de nuestro sitio web no tiene sentido pensar que respondan a ninguna intenci√≥n de b√ļsqueda.

En este caso simplemente deber√°s a√Īadir esta etiqueta a la secci√≥nde tu p√°gina.

Este m√©todo funciona muy bien cuando la etiqueta la a√Īades antes de que Google haya rastreado esa URL. Despu√©s, la verdad, es que te va a costar m√°s que Google la interprete correctamente.

Desindexar contenido en otros sitios web

¬ŅY si el contenido que necesitamos eliminar no lo hemos publicado nosotros y no podemos gestionarlo?

Ya no se trata de crawl budget o de SEO, pero nuestro nombre o nuestra marca se puede ver afectado por contenidos publicados en otros sitios. Es posible que se publique contenido ofensivo, que vulnera nuestra intimidad o que infringe derechos de autor.

Entonces, la √ļnica forma de eliminarlo de Google es solicit√°ndoselo al propio Google.

Afortunadamente Google nos facilita las herramientas necesarias para solicitar esta eliminación.

Si se trata de contenido ofensivo podremos solicitar su revisión y eliminación en un simple formulario que podremos encontrar aquí

Formulario para denunciar contenido inadecuado en Google

Si en cambio, el problema es de tipo legal sobre contenidos encontrados en cualquiera de los productos de Google podrás presentar tu solicitud de eliminación en esta otra página desde la que podrás solicitar la retirada del contenido.

Retirar contenido de Google

Parece que Google se toma muy en serio la revisión de todas estas solicitudes, por lo que seguramente te harán caso y, si corresponde, tomarán las medias oportunas.

Y t√ļ ¬Ņeliminas las URLs que sobran en tu web o las dejas agonizar mientras estropean los esfuerzos de tu SEO?