Aprende a usar Gsitecrawler para crear Sitemaps
Qué es un Sitemap
Los sitemaps son un archivo con un formato especial que nos ayuda a identificar la estructura de nuestra web y listar las páginas que la componen, Google ha establecido unas directrices en la creación de Sitemaps que nos ayudan a la hora de crear y enviar un Sitemap a Google y que indexe todas las páginas de forma más rápida.
Un sitemap tiene la siguiente estructura:
<?xml version=»1.0″ encoding=»UTF-8″?>
<urlset xmlns=»http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:image=»http://www.google.com/schemas/sitemap-image/1.1″ xmlns:video=»http://www.google.com/schemas/sitemap-video/1.1″>
<url>
<loc>http://www.example.com/foo.html</loc><image:image>
<image:loc>http://example.com/imagen.jpg</image:loc></image:image>
<video:video>
<video:content_loc>http://www.example.com/video123.flv</video:content_loc>
<video:player_loc allow_embed=»yes» autoplay=»ap=1″>http://www.example.com/videoplayer.swf?video=123</video:player_loc><video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
<video:title>Asar carne en verano</video:title>
<video:description>Consigue cocinar siempre la carne a la perfección </video:description>
</video:video>
</url>
</urlset>
Puedes ver un ejemplo de un sitemap completo en el Feed de este blog.
Que no crees un sitemap no significa que Google no va a encontrar todas las páginas de tu web, pero tardará más tiempo en hacerlo y puede que no indexe todas, si tu web es nueva o tiene pocos enlaces será más difícil que el robot de Google pase por ella, de igual forma que enviarlo tampoco te garantiza que indexe todas las páginas que envíes, es sólo una ayuda.
Si nuestra web es dinámica, generaremos páginas nuevas que debemos asegurarnos que Google indexa, así que tan importante como crear el sitemap es mantenerlo actualizado, hay muchos programas para hacer esto, de pago, gratuitos, web, de escritorio… hoy vamos a ver cómo crear sitemaps con Gsitecrawler, un software que lleva muchos años ayudándonos, de hecho, no se actualiza desde 2007 pero sigue cumpliendo con su función.
Crear sitemaps con Gsitecrawler
Descarga la última versión (1.23) desde su web oficial, Gsitecrawler: descargar Gsite crawler desde su web oficial.
Instala Gsitecrawler, es muy sencilla la instalación, durante la misma no podrás elegir como idioma español, pero una vez instalado en opciones generales sí podrás cambiarlo.
Antes de nada en Archivo, Opciones globales puedes realizar cambios en el programa como el idioma, número de crawlers que correrán a la vez, tamaño de los sitemaps máximo (se partirán en varios archivos)… no lo voy a explicar aquí paso a paso porque sería un coñazo, si lo que quieres es realizar tu sitemap de forma rápida y te encuentras con un tochazo de 10.000 palabras explicando cómo configurar cada una de las opciones del programa.
Añadir un nuevo sitio para crear su sitemap es muy sencillo, basta con pulsar el botón Add que aparece señalado en la imagen superior y nos saldrá una ventana emergente que nos pedirá si queremos ejecutar el asistente para añadir un nuevo sitio, pulsamos que si.
En la siguiente ventana simplemente debemos rellenar la URL del sitio web del que queremos crear el sitemap:
En nombre del proyecto podemos poner lo que queremos, aunque por defecto se rellenará con la URL que introduzcamos, la casilla ¿Omitir comprobación del servicio? evitará que el programa compruebe el estado del servidor antes de hacer el sitemap, por defecto la dejamos desmarcada.
En este segundo paso podemos configurar qué páginas y archivos queremos incluir en el sitemap, vamos a dejar marcada la primera pestaña de Distinguir entre mayúsculas y minúsculas.
Dejamos activa también la pestaña de Incluir filtros por defecto para las IDs de Sesión, así evitamos que se incluyan páginas con ID de sesión.
En lista de extensiones a comprobar incluimos las extensiones de los archivos de nuestra web, si está hecha en PHP sería .php, HTML .html, etc… por defecto se incluyen la mayoría de extensiones comunes en la creación de webs.
También podemos decidir si queremos incluir las imágenes en el sitemap, archivos de video o audio, documentos de texto, etc…
En este tercer paso podemos configurar el FTP de nuestra web, de forma que una vez terminada la creación del sitemap se suba automáticamente a nuestro servidor y además, se avise a Google de que el sitemap ha sido actualizado. Así nos evitamos estar pendientes de la creación del sitemap, de subirlo, de reenviarlo a WMT, sólo con ejecutar Gsitecrawler, que incluso podemos programar su ejecución lo hace todo por nosotros. Incluso si tenemos un VPS (aquí te explico cómo contratar uno en Banahosting) podemos dejarlo allí configurado y olvidarnos.
Al pulsar en TERMINAR, los crawlers empezarán a recorrer nuestro sitio recogiendo páginas.
Listo, ya sólo nos queda esperar a que termine de revisar nuestra web, tardará más o menos tiempo dependiendo de las páginas que tengamos en nuestra web (o el número de crawlers que le hayamos configurado).
Enviar Sitemap a Google Webmaster Tools
Crear nuestro sitemap no nos va a servir de mucho si Google no sabe de su existencia. Así que vamos a ver cómo enviarlo a través de la herramienta Google Webmaster Tools.
- Accede a tu cuenta de WMT
- Ve a la sección de Sitemaps
- Pincha en el botón AÑADIR O PROBAR SITEMAP
- Añade la URL del sitemap, antes de pinchar en ENVIAR, puedes pulsar en PROBAR para que Google verifique nuestro sitemap
- Una vez enviado, te aparecerá las URL que Google ha registrado, no quiere decir que las haya indexado
Referencia
Directrices en la creación de Sitemaps
Tutorial para enviar un Sitemap a Google Webmaster Tools de Google
FAQs de Gsitecrawler