Qué es un sitemap y guía para crearlo de forma correcta

De nada sirve disponer de la mejor web y publicar contenido de gran calidad si finalmente nadie acaba entrando en el sitio para verlo. El posicionamiento web en motores de búsqueda, y sobre todo en Google, es primordial para que cualquier proyecto web pueda generar tráfico web y alcanzar sus distintos objetivos. Aplicar una buena estrategia SEO se ha convertido en una tarea básica dentro del marketing digital para conseguir visibilizar una web y atraer a usuarios que coincidan con el target de la empresa.

Dentro de las distintas acciones que se utilizan en el SEO, los archivos sitemaps son muy interesantes pues ayudan a indexar antes el contenido en Google, ahorrando tiempo y esfuerzos a los administradores de la web o e-commerce.

A continuación, veremos qué es un sitemap, las ventajas que proporciona este archivo y cómo se puede crear un sitemap para comunicar a Google el contenido de una web y que lo indexe mucho más rápido.

Qué es un sitemap

Un sitemap o mapa del sitio es un pequeño archivo de texto que contiene una lista de URL de un sitio web, además de otra información importante sobre las mismas que ayudan a los motores de búsqueda a la hora de indexar el contenido de un sitio web.

Con un sitemap se indica al crawler o rastreador de Google sobre qué URL del sitio debe visitar para que las añada a su base de datos. Cuando hablamos de rastreadores de Google nos referimos a los bots que utiliza el buscador para analizar la web y añadir contenido a su índice de sitios (los conocidos como Googlebots).

Google favorece el uso de los sitemaps ya que les permite acelerar y facilitar el trabajo de sus bots a la hora de mantener su base de datos de sitios actualizada y bien organizada. Desde la propia herramienta Google Search Console, Google permite que los administradores les envíen sus archivos de mapa del sitio para que sus bots los rastreen en poco tiempo y de forma más eficiente.

Para ver el sitemap de una web, lo habitual es añadir su URL seguida del nombre de archivo del sitemap. Por regla general, se puede consultar o acceder a este sitemap utilizando la siguiente dirección web «https://www.nombrededominio.com/sitemap.xml

Es importante destacar que, además de Google, otros motores de búsqueda como Bing, Yahoo o Ask.com, también utilizan los sitemaps para facilitar a los administradores web la indexación de sus sitios web.

Cómo utilizar un sitemap

Veamos cómo hay que utilizar el archivo sitemap para poder indicarle a Google que rastree una serie de URL y las indexe en su base de datos:

  • Una vez creado el archivo sitemap con las URL que se quieren indexar, será necesario ir a Google Search Console.
  • En esta herramienta hay que ir a la opción sitemaps del menú principal izquierdo.
  • En la pantalla principal aparecerá un campo donde se puede introducir la URL donde se encuentra el archivo sitemap.
  • Pulsando el botón enviar se subirá el sitemap a Google Search Console para que la propia Google envíe a sus rastreadores a revisar el sitio según las referencias indicadas en el archivo.

Una vez enviado el mapa del sitio los rastreadores de Google tardarán un tiempo en visitar las URL indicadas, aunque siempre será un tiempo inferior al que tardarían en hacerlo de manera orgánica o natural.

En Google Search Console, debajo del campo para añadir un nuevo sitemap, se puede consultar otros archivos que ya se han enviado para su indexado, con información importante como sí ha sido enviado, fecha de la última lectura, el estado del archivo o el número de URL descubiertas. Haciendo clic en el icono de estadísticas que se presenta junto a la información de cada sitemap enviado se podrá acceder a un interesante informe de cobertura sobre cada una de las URL enviadas.

Cómo es la estructura de un sitemap

En un sitemap es necesario incluir una serie de etiquetas obligatorias, como son:

  • sitemapindex (etiqueta de apertura y cierre del sitemap).
  • sitemap (etiqueta para indicar cada una de las entradas).
  • loc (etiqueta para incluir la URL a indexar).

También se puede incluir etiquetas opcionales, como es el caso de la etiqueta lastmod, que se utiliza para indicar la fecha de la última modificación de la URL.

Veamos un ejemplo de la estructura de un archivo sitemap para comprender cómo se crea:

<sitemapindex>

<sitemap>

<loc>http://www.sitioweb.com/contact-us</loc>

<lastmod>2022-05-05</lastmod>

</sitemap>

<sitemap>

<loc>http:///www.sitioweb.com/about-us</loc>

<lastmod>2022-05-05</lastmod>

</sitemap>

</sitemapindex>

Cuándo es necesario contar con un sitemap de tu web

La creación y uso de sitemaps es ideal para cualquier página web, blog o tienda online pues permite indicar a Google de forma explícita, qué contenido es el más importante de su sitio, y por lo tanto, qué URL interesa más indexar.

Podemos indicar algunas de las situaciones más interesantes donde utilizar sitemaps:

  • En sitios web de reciente creación para que los Googlebots pasen lo antes posible a rastrear e indexar sus páginas.
  • Cuando una web añade nuevo contenido para acelerar el proceso de indexado (conseguir que aparezca el nuevo contenido en Google lo antes posible).
  • Para optimizar el crawler budget o presupuesto de indexado (optimizar el tiempo que disponen los Googlebots a la hora de indexar el sitio).
  • Para mejorar el posicionamiento web de sitios que no tienen muchos enlaces entrantes (backlinks)

Ventajas de contar con un sitemap

Aunque un sitemap es un archivo simple de texto que contiene información básica sobre páginas que forman un sitio web, se trata de una herramienta muy importante para el SEO debido a todas las ventajas que proporciona.

Los principales beneficios de utilizar archivos sitemap son:

Facilita el trabajo de Google

Los buscadores de Google tienen que recorrer infinidad de sitios web de forma constante para poder tener actualizada su base de datos. Con el envío de archivos sitemap se facilita el trabajo de los bots, pues saben qué URL deben de visitar y son alertados de nuevo contenido a contenido que ha sido curado o actualizado.

En un sitemap se indica el tipo de metadatos que contiene cada URL por lo que los Googlebots identificarán de forma inmediata el tipo de contenido que indexan (vídeos, imágenes, contenido para móviles…).

Acelera la idexación

Al subir un archivo sitemap se acelera el proceso de indexado, es decir, los Googlebots irán antes a rastrear e indexar el sitio que si se espera a que lo hagan de forma natural. Este es uno de los principales motivos por los que el uso de sitemaps es tan interesante para el SEO, pues mientras antes esté disponible las URL del sitio en las páginas de resultados, antes podrán ser encontradas por los usuarios en Google.

Optimizar el presupuesto de rastreo

Google asigna un tiempo determinado a sus crawlers para que rastreen un sitio web. Optimizar este presupuesto de rastreo es fundamental, sobre todo el webs muy grandes con gran cantidad de contenido.

El sitemap ayuda a indicar a Google cuál es el contenido importante que se debe indexar, evitando que el tiempo de rastreo se consuma analizando URL de escaso valor o que no se quiere que aparezcan en las búsquedas.

Agilizar la indexación de sitios dinámicos

Muchas webs generan contenido de forma constante, como es el caso de las webs de noticias digitales. Para conseguir que Google indexe todo este contenido de manera casi inmediata el uso de sitemaps se hace indispensable.

Mejorar el posicionamiento web

A Google le gusta que los contenidos se actualicen para tener su base de datos repleta de contenido valioso para los usuarios. En el archivo sitemap se indica la fecha de cada URL por lo que es ideal para indicar a Google que el contenido de una página ha sido actualizado, lo que ayuda a que mejore su posicionamiento web.

Formatos de un sitemap

Un sitemap se crea normalmente en formato XML, aunque también se puede utilizar en formato comprimido GZip para reducir su tamaño. El nombre de un archivo sitemap sería, por ejemplo «sitemap.xml», o en formato comprimido «sitemap.xml.gz

Otros formatos que se pueden utilizar para crear un archivo sitemap son:

  • TXT. Archivos simples de texto que se pueden crear con el bloc de notas, pero no son ideales cuando se incluyen fechas y otros datos complementarios al sitemap.
  • Atom-RSS. Formato utilizado principalmente para el sitemap de un blog pues incluye la fecha de publicación o actualización, algo fundamental para este tipo de sitios web.

Cuáles son las limitaciones del archivo sitemap

En un archivo sitemap hay que respetar una serie de limitaciones para que Google y otros motores de búsqueda puedan procesarlos de forma correcta. Estas limitaciones están relacionadas con el número de URL a incluir y con el peso del archivo (por eso se permite el uso de formato comprimido para no limitar el sitemap).

Los límites de un sitemap son:

  • Contener hasta 50 000 URL.
  • No sobrepasar los 10MB de peso.

Si por alguna circunstancia se sobrepasan alguna de estas dos limitaciones, será necesario dividir el sitemap en dos archivos diferentes, y subirlos a Google Search Console de forma independiente.

Cómo crear un sitemap XML

Veamos cómo crear sitemap XML de forma rápida y sencilla, y así poder subir este archivo a Google Search Console para indexar las URL que contienen.

Plugins de WordPress

Si se ha utilizado un CMS como WordPress se puede crear el sitemap de una web utilizando un plug-in o complemento específico para ello. Por ejemplo, con Yoast SEO se puede generar el archivo sitemap con todas las URL de la web con un solo clic, por lo que es uno de los más utilizados por los administradores de sitios web para mejorar el posicionamiento web e incrementar la visibilidad de sus sitios.

También existen plug-ins específicos para la creación de sitemaps personalizados donde se pueden seleccionar qué URL se quieren incluir. De esta forma se dispone de mayor flexibilidad a la hora de confeccionar los mapas del sitio ideales para optimizar el presupuesto de rastreo y conseguir que, el verdadero contenido importante del sitio, acabe siendo rastreado e indexado por Google.

Herramientas específicas

Existen herramientas especialmente diseñadas para crear y ver el sitemap de una web. Con el uso de estas plataformas es mucho más sencillo construir el archivo con el formato adecuado para que los crawlers puedan leerlos y comprenderlos sin problemas.

Por ejemplo, GSiteCrawler es una de las mejores herramientas para crear un sitemap XML pues incluye una opción de rastreo que analiza una web y todas su URL, creando el correspondiente archivo en formato XML.

Otras plataformas para crear el archivo sitemap de una web son CML-Sitemaps (con la limitación de hasta 500 URL por archivo) o la extensión para navegadores web Sitemap Generator (que automatiza el proceso de generación desde el propio navegador).

Crear el archivo sitemap de forma manual

Utilizando un editor de texto se puede crear el archivo sitemap de forma personalizada utilizando las distintas etiquetas y formatos adecuados, como pudimos ver anteriormente en la sección cómo es la estructura de un sitemap.

Es necesario utilizar la codificación UTF-8 a la hora de crear un mapa del sitio, además de cumplir con las limitaciones de este tipo de archivos en cuanto a número de URL y a tamaño máximo del archivo.

Hemos visto qué es un sitemap XML y por qué este tipo de archivos de texto son tan importantes para el SEO. Al utilizar un sitemap, una tienda virtual, página web o blog podrá indicar qué contenido o URL se indexan en Google y otros motores de búsqueda, facilitando el trabajo de los crawlers o rastreadores, y reduciendo el tiempo que tardan esas URL en estar disponibles en las páginas de resultados o SERP.

Qué es un sitemap y guía para crearlo de forma correctaEl proceso de creación de un archivo sitemap no es complejo, sobre todo si se utiliza una plataforma online o un plug-in de WordPress. Confeccionar manualmente este archivo necesita conocer las distintas etiquetas para poder configurar la estructura adecuada que puedan leer los bots de Google y otros motores de búsqueda.