Todo lo Que Necesitas Saber Sobre los Sitemaps XML
() translation by (you can also view the original English article)
Cuando hablamos de sitemaps, la mayoría de la gente piensa en una página web con enlaces. Sin embargo existe un tipo de sitemap mucho más útil: el Sitemap XML. ¿Cuáles son los beneficios de disponer un sitemap de este tipo? ¿Existen otros tipos de sitemaps? ¿Cómo se crea un Sitemap XML? Sigue leyendo para descubrirlo…
¿Por qué Necesitas un Sitemap?
Una pregunta que muchos de vosotros os estaréis haciendo es: "¿Por qué iba a añadir yo un sitemap a mi sitio?"
Explicado de forma sencilla, los sitemaps son muy útiles para que tu web se indexe correctamente; ayudan a los motores de búsqueda durante el proceso de escaneo del contenido.
Podrías comparar un sitemap con un mapa de carreteras pero en este caso para las arañas de Internet. Las arañas normalmente descubren nuevas páginas a través de los enlaces (href o src). Un sitemap sirve para comprobar doblemente la base de datos de los enlaces, permitiendo así descubrir páginas que de otra forma podría haber dejado pasar de largo. Como un extra, puedes proporcionar a las arañas información adicional sobre la URL añadiendo metadatos.
Esto es especialmente útil para sitios web nuevos o aquellos que hayan incrementado o actualizado recientemente una notable cantidad de páginas. Gracias a los sitemaps, los motores de búsqueda pueden encontrar las páginas mucho más rápido, reduciendo el tiempo total que necesitan para indexarlas.
Una cosa que no debes olvidar es que un sitemap no te garantiza que mediante la inclusión de una página concreta, esta vaya a ser necesariamente indexada. Si la página tiene poca calidad o tiene contenido duplicado, probablemente será excluida. Un sitemap simplemente sirve de ayuda a los motores de búsqueda a comprender la estructura de tu sitio.
Tipos de Sitemaps
Los sitemaps se podrían dividir en dos categorías: Sitemaps HTML y Sitemaps XML.
Sitemaps HTML
Hablamos de los sitemaps clásicos, que además suelen servir de guía a los visitantes para navegar la web. Suelen encontrarse normalmente en una página separada. Los Sitemaps HTML son fáciles de crear ya que se trata básicamente de páginas en las que muestras la estructura de tu sitio por medio de enlaces.
Como están construidos con HTML, podríamos añadir algo de CSS para salpimentar un poco las cosas, y mantener consistente el estilo visual con el resto de tu sitio. Si necesitas algo de inspiración, deberías echar un vistazo a SlickMap de Astuteo o el CSSsitemap System de David Leggett.
Junto a las ventajas obvias para los usuarios, los sitemaps HTML pueden ser también muy beneficiosos para el SEO. Si las arañas pueden encontrar con facilidad un enlace a un sitemap HTML, esto les podría ayudar a entender la estructura de tu página. No olvides actualizar tu sitemap si añades o eliminas páginas (probablemente tengas que realizar esta operación de forma manual).
Sitemaps XML
Los Sitemaps XML solo son utilizados por los motores de búsqueda. Todos los grandes motores de búsqueda (Google, Bing, Yahoo) utilizan sitemaps para el proceso de escaneo que realizan sus arañas.
Existen toneladas de herramientas online para ayudarte a generar automáticamente sitemaps (aquí tienes una lista útil). Si estás empleando un sistema de gestión de contenidos como WordPress o Joomla, hay un motón de plugins disponibles.
En cualquier caso es una buena idea tener algo de experiencia sobre como funciona un sitemap. Por ese motivo, en la siguiente sección vamos a crear un sitemap básico paso a paso.
Fuentes
HTML y XML son los formatos que se usan con mayor frecuencia para los Sitemaps. En cualquier caso, Google también acepta las fuentes RSS 2.0 y Atom 1.0. Puedes usar la URL de estas fuentes como sitemap. El problema con esta técnica es que las páginas anteriores a la creación del sitemap no serán incluidas.
Crear un Sitemap XML
La gran ventaja de un Sitemap XML es la inclusión de metadatos, permitiéndote proporcionar información adicional sobre el contenido de cada página. Un Sitemap XML puede crearse como sigue:
Paso 1: Crea un archivo de texto, pónle el nombre 'sitemap' y guárdalo con la extensión .xml.
Paso 2: Ahora tenemos que decirle a los motores de búsqueda cómo está codificado.
1 |
<?xml version="1.0" encoding="UTF-8"?>
|
2 |
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> |
3 |
</urlset>
|
Paso 3: En nuestro siguiente paso añadimos todas las URLs relevantes. Lo hacemos justo antes de cerrar la etiqueta urlset. Abajo encontrarás un ejemplo de una entrada de URL (no te preocupes, hablaremos sobre los diferentes elementos más adelante):
1 |
<url>
|
2 |
<loc>http://www.website.com/</loc> |
3 |
<lastmod>2012-12-12</lastmod> |
4 |
<changefreq>daily</changefreq> |
5 |
<priority>1</priority> |
6 |
</url>
|
- La etiqueta loc se emplea para enlazar a la página. Simplememnte introduce la URL entre dichas etiquetas.
- lastmod indica la fecha en la que la página fue modificada por última vez.
- Changefreq es, como ya habrás adivinado, la periodicidad promedio con la que cambian tus páginas (cada hora, semanal, mensual, anual…). Emplea 'never' para las URLs archivadas.
- También puedes priorizar ciertas páginas a través de la etiqueta priority. El rango de valores va desde 0.0 a 1.0 (siendo 1.0 el de mayor prioridad). La prioridad predeterminada de una página es 0.5. Asignar la máxima prioridad a todas tus páginas no te ayudará desde el momento en que la prioridad es relativa (solo se usa para establecer el rango de importancia entre las páginas del sitemap de tu sitio).
La etiqueta loc es obligatoria, mientras que lastmod, changefreq y priority, son opcionales.
Paso 4: Ahora que ya has creado tu sitemap es hora de que lo subamos a nuestro sitio. Debe ser incluido en el directorio raíz.
Cuando crees un sitemap, existen algunas cosas que deberías recordar:
- Todas las URLs de un sitemap provienen del mismo alojamiento.
- La máxima longitud de una URL es de 2,048 caracteres (lo que debería ser más que suficiente).
- Un sitemap puede contener un máximo de 50,000 URLs.
- El tamaño máximo para un archivo sitemap es de 50 MB.
Si tu sitemap es demasiado pesado, lo puedes dividir en varios sitemaps, en este caso tendrás que añadir también un archivo de Índice para el Sitemap. Esto es en esencia lo mismo que un sitemap normal, pero algunas etiquetas son nombradas de forma diferente. Observa este ejemplo:
1 |
<?xml version="1.0" encoding="UTF-8"?>
|
2 |
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> |
3 |
<sitemap>
|
4 |
<loc>http://www.website.com/sitemap1.xml</loc> |
5 |
</sitemap>
|
6 |
<sitemap>
|
7 |
<loc>http://www.website.com/sitemap2.xml</loc> |
8 |
</sitemap>
|
9 |
</sitemapindex>
|
El archivo de Índice para el Sitemap enlaza hacia dos sitemaps distintos a través de la etiqueta <loc>
. Teóricamente, un archivo de Índice Sitemap puede enlazar con hasta un máximo de 50.000 Sitemaps.
Sitemaps para Vídeo
También es posible crear sitemaps para vídeos. Puedes o bien crear un archivo por separado, o añadir la información relativa al vídeo a un sitemap ya existente. Añadir esta información incrementa la posibilidad de que tu vídeo se muestre como un rich snippet.
Recuerda que Google solo puede escanear los siguientes formatos de vídeo: wmv, mp4, mpeg, mpg, m4v, asf, flv, swf, avi, ra y ram.
Echemos un vistazo a un sitemap para vídeo de ejemplo y discutamos los diferentes elementos.
1 |
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" |
2 |
xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"> |
3 |
<url>
|
4 |
<loc>http://www.website.com/video-page.html</loc> |
5 |
<video:video>
|
6 |
<video:thumbnail_loc>http://www.website.com/video-thumbnail.jpg</video:thumbnail_loc> |
7 |
<video:title>Most Awesome Video Ever</video:title> |
8 |
<video:description>As the title says: this is the most awesome video ever. </video:description> |
9 |
<video:content_loc>http://www.website.com/video.mp4</video:content_loc> |
10 |
<video:duration>120</video:duration> |
11 |
</video:video>
|
12 |
</url>
|
13 |
</urlset>
|
- La etiqueta loc indica la página de la web en la que se encuentra el vídeo. Si el vídeo se usa para crear un rich snippet, esta será la página a la que será enviado cuando se pulse sobre la miniatura.
- video:thumbnail se usa para crear la imagen de vista previa para crear el rich snippet.
- Las etiquetas video:title…
- … y video:description se explican por si mismas.
- video:content enlaza con la localización del vídeo en el dominio.
- Y finalmente, la etiqueta video:duration, duración del vídeo que debería indicarse en segundos.
Existen muchas otras etiquetas que puedes añadir, como la calificación, el número de visionados, etc… Todas las etiquetas disponibles las puedes encontrar en los recursos de Google para Webmasters.
PS: Si estás teniendo problemas con la creación de un sitemap para vídeo, puedes usar este generador de sitemap para vídeo de Distilled. Es un archivo Doc de Google que puede generar automáticamente el código correcto. Todo los que tienes que hacer es copiarlo y pegarlo en tu sitemap.
Sitemaps de Imagen
El Sitemap para Imágenes es muy útil si quieres que tus imágenes aparezcan en los resultados de Búsqueda de Imágenes de Google. Esto puede proporcionarte algunos visitantes extra. Al igual que ocurre con el Sitemap para Vídeo, puedes añadir las imágenes a un Sitemap ya existente o crear un archivo por separado.
Un Sitemap de Imágen Básico será algo así:
1 |
<?xml version="1.0" encoding="UTF-8"?>
|
2 |
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" |
3 |
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"> |
4 |
<url>
|
5 |
<loc>http://website.com/page.html</loc> |
6 |
<image:image>
|
7 |
<image:loc>http://website.com/image1.jpg</image:loc> |
8 |
</image:image>
|
9 |
<image:image>
|
10 |
<image:loc>http://website.com.com/image2.jpg</image:loc> |
11 |
</image:image>
|
12 |
</url>
|
13 |
</urlset>
|
- Antes de nada necesitas especificar la página de la web en la que aparecen las respectivas imágenes. Puedes hacer esto a través de la etiqueta loc.
- Usa la etiqueta image:image para enumerar todas las imágenes de la página (hasta 1000).
Opcionalmente puedes añadir más información como un titular, información sobre la localización y el pie de foto.
Validar tu Sitemap
Todo el mundo sabe lo fácil que se deslizan los errores en tu código, así que sería una buena idea validarlo para asegurarte que está libre de errores. Existen multitud de herramientas online que pueden comprobar la validez de tu archivo, como por ejemplo el que encontrarás en www.xml-sitemaps.com.



Alternativamente podrías usar las Herramientas de Google para Webmasters para comprobar tus Sitemaps XML. Cuando pulses el botón añadir/probar Sitemap situado bajo optimización > sitemaps, podrás comprobar el sitemap antes de enviarlo.
Informar a los Motores de Búsqueda
Ahora que ya hemos creado y validado nuestro sitemap o sitemaps, es hora de informar a los motores de búsqueda sobre ello.
Pudes informar a Google y a Bing sobre la ubicación de tus sitemaps a través de de sus Herramientas para Webmasters. Para Google; accede a tu cuenta y dirígete a Optimización > Sitemaps. A mano derecha verás el botón 'añadir sitemap' o 'add sitemap' en inglés. Simplemente añade la URL de tu sitemap y ya lo tienes. En las Herramientas para Webmasters de Bing, busca el Widget Sitemap y pulsa 'enviar sitemap'. Aquí podrás introducir la ubicación de tu sitemap.
Alternativamente podrías añadir la URL a tu archivo robots.txt. Todo lo que tienes que hacer es añadir una línea extra a tu archivo, por ejemplo:
Sitemap: http://website.com/sitemap.xml
Si tienes un archivo de Índice de Sitemap, no necesitas añadir por separado cada sitemap individual.
Conclusión
Si quieres asegurarte de que las arañas no se pierden ninguna página o archivo importantes de tu sitio web, lo mejor es que añadas un Sitemap XML. Podrías incluso añadir metadatos adicionales como la frecuencia de cambios o la prioridad. Y además, podrías crear un sitemap para tus vídeos e imágenes.
Una vez que tu sitemap esté preparado, no te olvides de validarlo y notificar a los motores de búsqueda a través del archivo robots.txt o sus respectivas Herramientas para Webmasters.