Enlaces Rotos: detección y eliminación

Enlace RotoEn toda estrategía de enlaces debería de figurar, como primer punto, la revisión de enlaces rotos: tanto internos como externos.

En este artículo veremos como detectar y eliminar los enlaces rotos de nuestras páginas web.

Por mucho que nos esforcemos en personalizar y optimizar nuestra página de error 404, los enlaces rotos dan siempre generan una mala experiencia de usuario.

Por otra parte, los enlaces rotos de nuestra página pueden causar problemas graves de indexación. Cuando los robots de los motores de búsqueda rastrean un sitio van ‘saltando’ de enlace en enlace tratando de rastrear el mayor número de páginas en nuestro sitio. Cuando encuentran un enlace roto el proceso se detiene. Sin indexación no hay posicionamiento y, desde el punto de vista SEO, eso es lo peor.

La solución

Las dos posibles soluciones ante un enlace roto son: eliminarlo o redireccionarlo.

La eliminación del enlace pasa por una revisión de nuestro contenido para cambiarlo o simplemente quitar el hipervínculo de nuestro texto ancla (anchor text). Esta suele ser la solución cuando se trata de enlaces externos.

El redireccionamiento se puede hacer de varias formas, pero la más conveniente en este caso (que la página destino ya no existe) es editar el fichero .htaccess para crear una regla que redireccione la página inexistente a otra donde se encuentra el contenido buscado o donde se facilita información al respecto. El redireccionamiento se muestra como la mejor opción en casi todos los casos en los que es un enlace interno el que se rompe.

Este sería un ejemplo del código a incluir en el fichero .htaccess de nuestro servidor Apache para hacer un redireccionamiento 301

RewriteEngine On
Redirect 301 /path/pagina-que-ya-no-existe.html http://www.midominio.com/pagina-nueva.html

Detección de enlaces rotos

En muy pocas ocasiones podremos inspeccionar todos los enlaces de nuestro sitio manualmente y asegurarnos de que no hay ninguno roto. Para la detección de estos enlaces que no llevan a ninguna parte será mejor utilizar alguna herramienta que automatice el proceso.

La mejor herramienta dependerá básicamente del tipo de página, pero también de las preferencias personales del analista.

En esta ocasión veremos como realizar esta tarea utilizando Webmasters Tools de Google. Lo haremos con esta porque es una herramienta muy extendida y al alcance de todos.

Sin embargo existen en el mercado muchas utilidades (tanto online como de escritorio) que realizan una gran labor en la detección de enlaces. Algunas de ellas son:

W3C Link Checker: Sí, efectivamente: los del validador de código de nuestra página también nos ‘validarán’ los enlaces. Lamentablemente muchos se quejan de que los resultados no son tan buenos como cabría esperar de ellos, puesto que solo analiza los enlaces externos.

Xenu: Esta no os la puedo recomendar personalmente, pues no la he utilizado. Sin embargo me ha parecido necesario dado la gran cantidad de usuarios que tiene. Se trata de una aplicación de escritorio gratuita. Solo está disponible para el entorno de Windows.

Broken Link Checker: Es un plugin específico para el CMS de WordPress, pero debido al uso extendido de esta plataforma y los buenos resultados de este plugin no está de más incluirlo en la lista.

Hay otras herramientas de pago como Link Tiger (online) o DeepTrawl (de escritorio) que sin duda son excelentes y añaden un plus a modo de fácilidad de corrección u otros análisis complementarios. Sin embargo, me parece que para la tarea que nos ocupa la oferta gratuíta es más que suficiente.

Webmasters Tools de Google

El proceso para detectar e identificar enlaces rotos en WMT es muy sencillo. Una vez que accedemos a la administración de nuestro sitio en el panel de WMT, escogemos opción “Errores de Rastreo” dentro del menú desplegable de “Salud”

(Salúd >> Errores de Rastreo)

En este panel se nos muestran dos grupos de errores: “del sitio” y “de URL”. Este segúndo grupo es el que nos va a ocupar para hacer el seguimiento de los enlaces rotos.

En esta sección lo primero que se muestra es una cabecera donde se muestran los errores que existen o existieron, así como el número de enlaces que presentan estos errores.
11 errores "No se encuentra" en WMT En el ejemplo anterior vemos como hay 11 enlaces rotos, pero también existen otros 4 errores de url (que en este caso son errores de sintáxis) y muestra también la leyenda de “Error de servidor”, a pesar de no existir ningún error de este tipo. Esto es porque, en algún momento, existieron errores de este tipo que se mantienen en el histórico.
1 error de URL 404 WMTEn este otro caso vemos que tan solo existe 1 enlace roto y no se han registrado otros errores de URL en el sitio.

Bajo esta cabecera se muestra el histórico de cada error a modo de gráfico.
Gráfico de errores de URLSi pulsamos sobre cualquiera de los nodos, se nos muestra un globo de información para un rastreo concreto.

Por último (y sin duda la parte más importante), se nos muestran las 1.000 páginas principales con errores. No se trata, en realidad, de un listado de páginas. Es un listado de enlaces que devuelven el error 404, es decir, enlaces rotos. Cabe destacar que estos enlaces serán tanto internos (hacia páginas de nuestro propio sitio), como externos (a sitios web de terceros)

Enlaces con errores en WMT

Pulsando sobre el enlace que dió error, WMT nos muestra una ventana con 3 pestañas donde se nos amplia la información de ese enlace roto en particular:

  • Detalle del error: que incluye la fecha en la que detectó el error, la fecha del último rastreo en que el error seguía vigente y una pequeña explicación de Google sobre posibles causas del mismo.

Detalle de error 404 WMT

Es curioso que Google nos dice en esta pestaña que los errores 404 no influyen en el posicionamiento. Pero como hemos explicado antes sique influyen en la indexación, y como consecuencia en el posicionamiento de las páginas que no se indexan. (Google… ¡ellos que sabrán!)

  • En Sitemaps: En esta pestaña nos mostrará la información de los sitemaps en los que se incluye este enlace (si es que se incluye)
  • Enlazada desde: Este listado será nuestro guía, pues tendremos que ir a todas esas páginas de nuestro sitio a solucionar el problema. En esas páginas, en alguna parte, se incluye un enlace que no lleva a ninguna parte.

404 enlazadas desde... WMT

A menudo, observando el destino de los enlaces podremos determinar la causa de que el enlace se haya roto. Habrá que revisar:

  1. Páginas que hemos borrado:la solución será crear un redireccionamiento 301 de estas direcciones que ya no existen a otra página que nos resulte más conveniente. También se puede, simplemente, eliminar el enlace.
  2. Errores en la dirección escrita: A menudo hemos redactado mal el código del enlace y esto provoca que no llegue a su destino (espacios en la url, mayúsculas y minúsculas, url generadas dinámicamente). El copiar y pegar url suele ser una práctica muy recomendable al escribir las urls en el código (evita errores humanos).
  3. Páginas externas que han cambiado o desaparecido:enlaces a otros sitios que han eliminado ciertas páginas, imágenes o videos de servidores externos que han sido restringidos o eliminados,… Este último caso justifica la realización de auditoría periódica de los enlaces del sitio que mantenemos. La frecuencia de esta dependerá mucho de la naturaleza del sitio y el tamaño, pero como mínimo a cumplir a mi me gusta aquello de “una vez al mes no hace daño”, (aunque en la mayoría de los casos es muy recomendable aumentar esta frecuencia).

Una vez que emos detectado los enlaces que no funcionan, así como las páginas que los contienen, tendremos que ir editando estas últimas para corregir los errores.

Por último, volvemos a las Webmasters Tools de Google marcamos el error del enlace como solucionado en la ventana de detalle del enlace

Botón "Marcar como solucionado"o bien podemos marcar varias a la vez, desde la lista de enlaces con error. Para ello marcamos el ‘check’ de cada enlace que queremos dar por solucionado y pulsamos en el botón “MARCAR COMO FIJAS”

Marcar como fijas WMT

Este botón puede llevar a confusión, puesto que se trata de otra ‘desgraciada’ traducción inglés-español. El texto original “Mark as fixed” significa en realidad “Marcar como arreglado”.

Espero que este artículo os haya servido de ayuda para optimizar un poco más vuestras páginas.

Y vosotr@s… ¿Que herramientas usais para detectar y corregir los enlaces rotos? ¿Cada cuando tiempo los revisais?

Artículos Relaccionados:

About The Author

Related Posts