Qué es y cómo se realiza la indexación de contenidos a Google

Desarrollar una página web utilizando la última tecnología, incluyendo un diseño llamativo y original, ajustando una carga rápida del contenido, aportando una amplia variedad de funciones y una usabilidad amigable, no sirve de mucho si no genera tráfico. La visibilidad de una web depende en su mayor medida de las visitas que obtiene a través de los distintos buscadores web, y en especial de Google. La indexación de una página web en Google permite que los usuarios la encuentren cuando realicen búsquedas sobre temáticas o categorías relacionadas por la misma. Si un sitio web o alguna de sus URL no están indexadas en Google, simplemente no existe.

Veamos qué es la indexación y cuál es su importancia para una web, y cómo saber si un sitio web se encuentra indexado, aprendiendo cuáles son las acciones a realizar para acelerar el proceso de indexación en Google.

Qué es la indexación

El término indexación viene de la palabra inglesa index (índice) y consiste en el proceso por el cual las URL de una página web se añaden al índice del buscador Google. Si una web no ha sido indexada por Google, los usuarios no podrán encontrarla a través de Google al no aparecer en los resultados de búsqueda.

En el momento en el que Google añade una web a su base de datos, y por lo tanto se encuentra ya en su índice, se puede decir que dicha web ha sido indexada. Para indexar una web, Google utiliza las conocidas como arañas, que no son más que bots que rastrean y analizan la web para clasificar y añadir sitios web a su índice.

El proceso por el cual Google añade un sitio web o página a su índice demora demasiado tiempo, por lo que es interesante acelerarlo, ayudando a Google a encontrar, analizar e indexar dicha web.

Los algoritmos de Google analizan y clasifican una web indexada, lo que resultará que se muestre en una mejor posición en los resultados de búsqueda. Es posible realizar muchas acciones sobre una web para mejorar el posicionamiento SEO y hacer que una página se muestre en las primeras posiciones de Google, generando una gran cantidad de tráfico web.

El índice de Google contiene billones de páginas web, además, diariamente se añaden miles de nuevas URL, por lo que el trabajo de los bots de Google es inmenso. Ante esta situación, favorecer el trabajo de estas arañas rastreadores de Google es vital para acelerar el proceso que tarda Google en añadir una web a su índice y conseguir que aparezca en los resultados de búsqueda.

Cómo favorece la indexación a tu sitio web 

La indexación de un sitio web en la base de datos de Google aumenta las visitas o tráfico web, lo que aporta una serie de beneficios como:

  • Permite aumentar las conversiones (de visitantes a usuarios registrados o clientes).
  • Aumenta el alcance de cualquier acción de marketing digital.
  • Facilita el lanzamiento de productos y servicios, por ejemplo, en un e-commerce.
  • Aumenta la difusión y conocimiento de la empresa, marca o productos.

Cómo saber si tu contenido está indexado

Para saber si un contenido ya se encuentra indexado en Google basta con introducir en un navegador la dirección completa de la página. Si se encuentra indexada, aparecerá en la primera posición de los resultados de búsqueda.

Utilizando el comando “site” se puede ver todo el contenido indexado de un sitio web. Para utilizarlo hay que introducir en un navegador: site.tu-dominio, y en los resultados de búsqueda aparecerán todas las URL indexadas de dicho dominio.

Cuándo fue su última vez que Google pasó por tu web

Para conocer cuál fue la última vez que los bots de Google se pasaron por tu web, existe un comando que se puede introducir en cualquier navegador y que mostrará la fecha y hora de la última visita y una captura del estado de la web en ese momento. El comando a introducir es: cache:tu-dominio.com.

Qué tengo que hacer para acelerar la indexación de mi sitio web

Las arañas se encargan de analizar, clasificar e indexar en Google las páginas web, pero es posible realizar diversas acciones para facilitarles su trabajo. Entre las distintas medidas que se pueden realizar para mejorar y acelerar la indexación de un sitio web en Google tenemos:

Google Search Console

Google Search Console es una herramienta gratuita de Google que permite vincularse con sitios web para poder realizar distintas acciones y obtener información relevante. Una vez autenticada la propiedad de un sitio web añadido a Google Console se puede “forzar” a que Google rastree una URL del sitio, lo que acelera su inclusión en el índice.

Para añadir una URL y decirle a Google que quieres que la incluya en su índice hay seguir los siguientes pasos:

  1. Ir al menú principal de Google Search Console.
  2. Seleccionar el apartado Inspección de URL.
  3. Introducir la URL completa de la página que se quiere añadir.
  4. Google hará una comprobación automática para ver si la URL ya se encuentra en su base de datos.
  5. Si la web no está indexada, Google lo tendrá en cuenta y hará que sea revisada en poco tiempo (probablemente en unos pocos minutos).

Desde Google Search Console también se puede comprobar si existen problemas con la indexación de URL, detectando fallos y forzando correcciones desde la propia plataforma. Los principales errores por los que una página no se indexe en Google tienen que ver con errores de DNS (Google no ha podido acceder al sitio en el momento del rastreo) y errores de servidor (Google si llega a la URL pero esta muestra un error de carga o tarda mucho tiempo en cargar el contenido por un fallo en el hosting), errores de acceso a la información del archivo robot.txt, errores de URL (relativos a una URL concreta que muestra un error 404). 

Otra de las funciones de Google Search Console es la de ver con qué frecuencia aparecen las URL indexadas de un sitio en las búsquedas (por palabras clave) y con qué frecuencia los usuarios hacen clic en dichas consultas. 

Crea un sitemap

Un sitemap es un archivo que contiene el índice de URL que conforman una página web (en formato .XML). Generando este archivo se puede facilitar el trabajo de los bots de Google a la hora de analizar un sitio web.

Desde Google Search console es posible añadir un archivo sitemap para hacer que Google disponga del índice de una web y el proceso de añadir nuevo contenido o actualizado del sitio sea un proceso mucho más rápido y efectivo. 

Para añadir un sitemap a Google Search Console hay que seguir los siguientes pasos:

  1. Crear manualmente el sitemap incluyendo la información de las distintas URL. Los gestores de contenido (como WordPress) permiten generar los sitemaps de un sitio de forma automática, lo que facilita mucho esta tarea que puede ser ardua y requerir de mucho tiempo y esfuerzo.
  2. Ir a Google Search Console y seleccionar la web correspondiente al sitemap (en caso de que se tuviese diversas páginas vinculadas con Google Search Console).
  3. En el menú principal de Google Search Console ir al apartado Sitemaps.
  4. En la parte superior se puede introducir la URL donde se encuentra el archivo del sitemap. Tras introducir esta URL, pulsar el botón enviar.
  5. En la parte inferior se mostrará información sobre los sitemaps enviados, incluyendo fecha de envío, fecha de última lectura por parte de Google, estado del sitemap y URL descubiertas por Google gracias a ese archivo.

Hay que tener en cuenta que los sitemaps tienen sus limitaciones, ya que admiten hasta 50 000 URL y el tamaño del archivo no puede ser superior a 50 MB. Sin embargo, esto no supone un problema, porque se pueden enviar distintos sitemaps a Google desde Google Search Console, por lo que si un sitio web supera esas cifras de URL o tamaño del archivo sitemap, solo necesitará generar un segundo sitemap.

Gestión del archivo robots.txt

El archivo robots.txt contiene aquellas URL de un sitio web que no interesan que sean indexadas por Google (como por ejemplo páginas de información sobre política de privacidad o cookies).

Incluyendo el archivo robot.txt en la raíz del dominio hará que las arañas de Google no indexen (ignoren) las URL incluidas en dicho archivo.

Hay que tener cuidado a la hora de añadir URL dentro del archivo robots.txt para no incluir por error páginas que deben ser indexadas como una categoría de productos o una Landing Page.

Actualizar contenidos periódicamente

Los algoritmos de Google están diseñados para favorecer a aquellas páginas que sean dinámicas, es decir, que modifiquen o añadan contenido de forma periódica. Incluir contenido a menudo en una web (a diario, cada pocos días, o semanalmente) hará que los bots de Google pasen más a menudo por la web y la analicen.

Por eso es muy interesante añadir un blog a una página web para poder ir añadiendo contenido relacionado de forma periódica y forzar a que Google visite la web y añada el contenido.

Si se añade contenido de forma periódica se conseguirá que cada nuevo post o cambio se añada al índice de Google de forma muy rápida (en horas o minutos).

Organización interna de la web

Disponer de una organización de la web utilizando categorías y subcategorías y haciendo uso de enlaces internos a contenido relevante, facilitará el rastreo por parte de los bots de Google. Por ejemplo, añadir enlaces a contenido relevante del sitio en los nuevos post que se añaden en el blog hará que la navegación y usabilidad por una página web sea mucho más sencilla y dinámica, y por lo tanto facilitará el indexado y premiará el posicionamiento web del sitio.

Uso de Keywords y etiquetas

Las palabras clave de un sitio web avisan a los bots de Google sobre la temática de la que se trata una determinada web. Utilizar palabras claves de forma apropiada en el contenido del sitio facilita que el algoritmo clasifique e indexe un sitio web de forma eficiente y en mucho menos tiempo.

Las etiquetas en los post de blogs también facilitan la clasificación del contenido por temáticas, ayudando a su vez a que el algoritmo comprenda mejor la estructura de la web y de los distintos temas de los que trata. El uso de etiquetas favorece la indexación de páginas en Google.

Hemos visto qué es indexar y por qué es tan importante añadir lo antes posible el contenido de una web a la base de datos de Google. A pesar de que Google rastrea la web de forma automática con sus arañas en busca de nuevo contenido o modificaciones realizadas en sitios ya indexados, este proceso puede tardar demasiado tiempo. Con la herramienta gratuita Google Search Console se puede indicar a Google una URL específica que se quiere añadir a su índice y así acelerar el proceso.

Ir introduciendo una a una todas las URL de un sitio web para añadirlas más rápidamente al índice de Google es un proceso tedioso en el que habría que invertir una gran cantidad de tiempo y esfuerzo. Afortunadamente, con el uso de los sitemaps, se le puede indicar a Google el índice completo de una web con todas sus URL para que las añada a su base de datos. Este archivo sitemap se puede generar de forma automática con plataformas como WordPress y solo habrá que proporcionar desde Google Search Console la URL donde se encuentra dicho archivo, para que Google rastree el sitio completo y lo indexe.

El posicionamiento web se encarga de mejorar la posición de un sitio web indexado en los resultados de búsqueda de Google. Las empresas invierten muchos recursos y esfuerzo en sus estrategias de marketing digital para mejorar el posicionamiento SEO y ganar visibilidad de sus sitios web, tiendas online, blogs, sitios corporativos o webs formativas. Para poder aplicar todas las medidas que ayuden a mejorar la posición de una web en Google es necesario que el contenido nuevo o modificado se indexe lo antes posible en Google y de forma correcta.