Magnetia — Agencia de marketing digital, IA y diseño web
Glosario · SEO B2B

¿Qué es un Sitemap XML y por qué Google lo trata como la lista oficial de tus URLs?

Archivo XML que lista todas las URLs indexables de tu sitio. Estructura, etiquetas opcionales, sitemap index para sitios grandes y errores típicos en pyme B2B.

Auditar mi sitemap

Actualizado mayo 2026

Definición

Sitemap XML: la lista estructurada de URLs que quieres que Google indexe.

Un sitemap XML es un archivo en formato XML que lista las URLs de tu sitio que quieres que los buscadores rastreen e indexen. Es la forma directa de decirle a Google: "estas son las páginas importantes de mi sitio". Estándar publicado en 2005 por Google, Yahoo y Microsoft (sitemaps.org).

Cumple varias funciones: (1) ayudar a Google a descubrir URLs nuevas más rápido (especialmente en sitios grandes o profundos), (2) declarar metadata útil como fecha de última modificación (lastmod), (3) separar sitemaps por tipo de contenido (posts, productos, imágenes, vídeos), (4) servir de fuente para el informe Páginas de Search Console.

No garantiza indexación: Google puede ignorar URLs del sitemap si las considera de baja calidad, duplicadas o bloqueadas. Lo que sí hace: acelera el descubrimiento y proporciona señal de qué páginas consideras importantes. Las etiquetas priority y changefreq son históricamente ignoradas por Google; solo lastmod tiene peso real cuando se mantiene actualizado.

En pymes B2B españolas, los problemas más comunes son: sitemap autogenerado por plugin que incluye URLs noindex o redirigidas, sitemap sin actualizar tras publicaciones (lastmod estático), sitemap no enviado a Search Console, sitemaps gigantes monolíticos en lugar de divididos por tipo. Cada error reduce eficiencia de rastreo.

Estructura básica

Anatomía de un sitemap XML bien construido

Etiqueta <urlset>

Contenedor raíz del sitemap. Declara namespace XML: <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">. Dentro van las URLs individuales.

Etiqueta &lt;url&gt; con &lt;loc&gt;

Cada URL del sitio va en un bloque <url> con su <loc> (URL absoluta, incluido https://). Es el único campo obligatorio. URLs deben ser canónicas y indexables.

&lt;lastmod&gt; (recomendada)

Fecha de última modificación del contenido en formato W3C (2026-05-12 o 2026-05-12T10:30:00+02:00). Google la usa para priorizar rastreo. Solo útil si refleja cambios reales, no fecha automática genérica.

&lt;priority&gt; y &lt;changefreq&gt; (ignoradas)

Prioridad (0.0 a 1.0) y frecuencia de cambio (daily, weekly, monthly). Google las ignora oficialmente desde 2017. Pueden incluirse pero no aportan valor real. Mejor centrarse en lastmod.

Sitemap index

Sitio con >50.000 URLs o >50MB: dividir en varios sitemaps y crear un sitemap index que los liste. Patrón común: sitemap-posts.xml, sitemap-pages.xml, sitemap-products.xml + sitemap-index.xml.

Sitemaps especiales

Para imágenes (image:image), vídeos (video:video), noticias (news:news), hreflang multilingüe (xhtml:link). Tipos especializados que aportan metadata adicional a Google.

2005
Año en que se publica el estándar
50.000
Máximo URLs por sitemap
50 MB
Tamaño máximo (sin comprimir)
lastmod
Etiqueta opcional con más peso real
Errores comunes

Cinco errores típicos al gestionar sitemap XML

Incluir URLs con noindex o canonical hacia otra

Sitemap lista URLs que tienen meta noindex o canonical hacia otra URL. Señal contradictoria a Google: "indexa esto" pero "no la quiero indexada". Limpiar sitemap para que solo contenga URLs canónicas e indexables.

Sitemap autogenerado sin curar

Plugins SEO generan sitemap automáticamente incluyendo tags pages thin, paginaciones, drafts, URLs con parámetros. Resultado: sitemap inflado de URLs sin valor SEO. Configurar para excluir lo que no aporta.

No enviarlo a Search Console

Generas sitemap pero no lo envías a Google Search Console > Sitemaps. Google puede encontrarlo via robots.txt, pero el envío manual a GSC habilita reportes detallados de cobertura.

lastmod no refleja cambios reales

Plugin pone lastmod = fecha de hoy en todas las URLs cada noche. Google detecta el patrón (todas cambian a la vez) y deja de fiarse. lastmod debe reflejar cambio real de contenido para tener valor.

No actualizar tras migración o cambio de dominio

Migración a HTTPS o cambio de dominio: sitemap sigue listando URLs antiguas. Google rastrea URLs muertas, malgasta crawl budget. Actualizar sitemap inmediatamente tras cualquier cambio estructural.

Cómo se relaciona con otros conceptos

Sitemap XML en el SEO técnico.

Sitemap XML es complementario a robots.txt: uno señala qué quieres indexado, el otro bloquea lo que no. Es buena práctica declarar el sitemap en robots.txt: Sitemap: https://www.magnetia.io/sitemap.xml.

Se conecta con canonical URL: las URLs del sitemap deben ser canónicas. Si listas dos URLs duplicadas en el sitemap, mandas señal contradictoria a Google. Solo canónicas en el sitemap.

Y con internal linking: aunque el sitemap ayuda al descubrimiento, una página descubierta solo por sitemap sin enlaces internos sigue rankeando mal. Sitemap + buen interlinking + contenido son complementarios. Magnetia audita sitemap en CRO web B2B. Ver también SEO técnico pymes.

Preguntas frecuentes

Dudas que nos hacéis llegar

Archivo XML que lista las URLs de tu sitio que quieres que los buscadores rastreen e indexen. Estándar abierto desde 2005 (sitemaps.org), reconocido por Google, Bing y Yandex.
45 min, sin compromiso

¿Tu sitemap está limpio o lleno de URLs basura que confunden a Google?

Auditamos tu sitemap actual, identificamos URLs problemáticas y lo reconstruimos para optimizar crawl budget y descubrimiento.

Hablemos