Cómo solucionar problemas de rastreo en Google

Uno de los primeros pasos en el posicionamiento web es comprobar que el rastreo y la indexación de nuestra web es correcto, para eso, la herramienta Search Console (antiguo WebMaster Tools) se convertirá en nuestra mejor aliada.

Rastreo en Google tipo Sherlock

El rastreo es el proceso por el cuál los robots de búsqueda descubren nuestro contenido. Cuando publicamos una web nueva o creamos una página o un post, la mejor forma que tiene Google de llegar al mismo es a través de los enlaces.

Si es un site es nuevo tendremos dos formas rápidas de darlo a conocer a los robots, a través de la solicitud de Submit Content de Google, para lo cual debemos haber verificado antes la web en Search Console, o consiguiendo un enlace de relevancia hacia nuestro dominio, bien a través de un directorio especializado de nuestra sector o en redes sociales.

Cuando de lo que se trata es de dar a conocer un contenido nuevo de una web preexistente yo siempre suelo recomendar publicar un tweet con el enlace como vía rápida. Es cierto que el robot debería llegar a nuestra página a través de los enlaces internos, sin embargo, su rapidez en encontrarla dependerá tanto de la estructura y navegación web (que sea capaz de llegar al mismo en menos de tres clicks y a través de enlaces textuales y no JavaScript) y de la frecuencia de publicación.

Para entenderlo mejor, Google suele pasar por tu página en función de cada cuánto publiques. Si lo haces semanalmente te visitará mucho menos que si lo haces todos los días, de ahí que sea a veces complicado determinar cuándo un contenido es original. Imaginemos que yo publico todos los lunes y no lo comparto a través de los medios sociales, mientras que otro que lo hace tres o cuatro veces al día copia y pega mi contenido y lo publica modificando la hora para que parezca que lo ha publicado antes. El robot pasará más a menudo por su página que por la mía, por lo que es probable que lo detecte antes en la suya, eso sí, luego entrarían otros aspectos como la relevancia del site, el porcentaje de contenido original del resto de la web, factores sociales…

Esta frecuencia de rastreo puede ser modificada también a través de Search Console, pero no es recomendable alterarla, a no ser que hayas hecho un cambio sustancial en la web y quieras que vuelva a visitar todo el sitio.

Otra de las formas de controlar el rastreo, en este caso para decirle si deseas o no que una página sea tenida en cuenta, es a través de la etiqueta o el archivo robots.txt, que no es otra cosa que una “orden” para que no indexe o no siga una URL o un conjunto de ellas, directorios concretos o incluso todo el site.

Dos de los errores más comunes que suelen cometerse referentes al rastreo son:

Tener una web en test o pre-producción y dejarla abierta a los robots, es decir, no tenerla cerrada con User y Password o no haber puesto un Disallow: / en nuestro archivo robots.txt. De hecho, hay varios ejemplos de sites que se han indexado antes de que la empresa en cuestión los hubiese terminado y tuviese intención de publicarlo.

Una vez pasada la web a producción dejar el meta o archivo robots bloqueando a los bots. Algo más común de lo que os imagináis y la respuesta más frecuente a: “subí mi página hace una semana y me busco por el dominio y no salgo en Google”. De ahí que si os sucede esto lo primero que debáis comprobar es que no existe ningún etiquetado en el HEAD bloqueando el rastreo e igualmente poniendo www.midominio.com/robots.txt en el navegador.

Por último, y como he comentado antes, los robots rastrean a través de los enlaces, por lo que debes asegurarte que pueden navegar correctamente en tu web, para ello puedes descargarte el navegador Lynx o la extensión de Chrome Web Developer. En este último caso, accede a tu sitio y desactiva el JavaScript y CSS e intenta llegar a tu contenido a través de los enlaces textuales. Si hay alguna parte a la que no puedes acceder es posible que los robots tampoco puedan hacerlo.

Stop marketing, start engaging Tweet about this on TwitterShare on LinkedIn0Share on Google+0Share on Facebook3Buffer this pageEmail this to someone

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *