sitemap

Como generar un archivo SiteMap

Ya habíamos comentado que el archivo Sitemap es el que contiene la lista de todas las páginas web de nuestro Site; es importante porque al no existir estamos dejando a la voluntad de los Buscadores el correcto y completo indexamiento de todo nuestro Sitio Web.

sitemap

Hay distintas herramientas Web que nos permiten generarlo; aquí algunos ejemplos:
http://www.web-site-map.com/
http://www.xml-sitemaps.com/

Sin embargo, es necesario comentar que estas Herramientas Online, al ser gratuitas tienen algunas limitaciones como:

  • Es posible que nos inserten algún enlace incorrecto (dentro del mismo Sitio Web)
  • Tienen un límite de páginas que listan; generalmente de 500. Esto es ideal para Sitios Web pequeños.
  • Tienen un límite de profundidad; es decir que solo listaran las páginas enlazadas desde el Home Page y sus principales niveles (categorías). Si hay contenido dentro de categorías que están dentro de categorías (sub-niveles) es posible que no lo ubiquen.

Ahora, si desean Uds. mismos generar el archivo Sitemap, es necesario que sepan algunas cosas:

  • El archivo debe llamarse sitemap.xml (en minúsculas)
  • La ubicación del archivo debe ser la raíz del Sitio Web (ejemplo: www.tusitioweb.com/sitemap.xml)
  • El formato del archivo es XML; deben conocer un poco del protocolo antes de modificarlo.
  • Dentro del archivo SOLO pueden existir páginas de ese Sitio Web; si el Sitio Web es http://www.tusitioweb.com no pueden enlazar páginas de http://blog.tusitioweb.com
  • Debe haber solo 1 URL por línea
  • Los URLs deben ser completos (incluyendo el http://)
  • El archivo Sitemap puede contener un máximo de 50,000 URLs y no puede pesar más de 10MB (10,485,760 bytes).

Un ejemplo de un archivo básico es:

 

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://www.tusitioweb.com/</loc>
<lastmod>2014-05-14</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
</urlset>

 

Donde:

  • loc: URL de la ubicación de la página web a indexar
  • lastmod: La fecha de última modificación del contenido de ese URL; el formato es YYYY-MM-DD
  • changefreq: La frecuencia en la que este URL cambia de contenido; los valores posibles son: always, hourly, daily, weekly, monthly, yearly, never
  • priority: Prioridad del URL dentro del Sitio Web; no es la prioridad de indexamiento sino que es buena idea darle prioridad más alta a URLs de menús como cabezas de categorías. Los valores van desde el 0.0 al 1.0 (0.5 es el valor por defecto)

Más información: (es bastante técnico)
http://www.sitemaps.org/protocol.html

Finalmente, es una buena idea que informen a los Buscadores que tienen un nuevo Sitemap creado; para hacer eso hay 3 formas:

1) Enviar la ubicación del Sitemap mediante la página de altas de cada buscador (search engine’s submission interface)

2) Especificar la ubicación del Sitemap dentro del archivo robots.txt

3) Enviar manualmente la ubicación del Sitemap vía HTTP. Pueden digitar el siguiente URL <searchengine_URL>/ping?sitemap=sitemap_url

Donde:

  • <searchengine_URL> = dirección del buscador como www.google.com u otros
  • sitemap_url = URL de su archivo Sitemap; ejemplo: http://www.tusitioweb.com/sitemap.xml

 

 

Deja un comentario