Logotipo de Zephyrnet

Corrección de errores del mapa del sitio para una mejor indexación de las URL enviadas

Fecha:

04 de Agosto, 2023
Lectura de 19 min

Así que acaba de crear un mapa del sitio y lo envió a Google. ¡Felicidades! Pero espera, el estado de tu mapa del sitio no es un éxito. Por otro lado, tal vez su informe de mapa del sitio se vea bien, pero después de verificar el Indexación de páginas reporte, Parece que Google ha ignorado su cortés solicitud y no indexará una buena parte de las páginas de su mapa del sitio. Ahora se pregunta si hay algo que pueda hacer para mejorar sus estadísticas de indexación. 

No busques más porque encontrarás todas tus respuestas en esta publicación.

Si aún no tienes un mapa del sitio y quieres aprender cómo crear uno que brille, echa un vistazo a nuestro Curso intensivo de introducción al mapeo de sitios. Aprenderá todo sobre los beneficios de tener un mapa del sitio y descubrirá varias de las mejores prácticas para los mapas del sitio. Es importante consultar una guía de todos modos, especialmente si aún no sabes qué y se utilizan las etiquetas, o si aún no está familiarizado con los mapas de sitios de vídeo o los archivos de índice de mapas de sitios.

La primera parte de esta publicación enumera todos los errores potenciales que puede encontrar en su Google Search Console. Sitemaps informe. Si está trabajando en la solución de problemas, puede utilizar una tabla de contenido para navegar hasta los errores en los que se centra. 

El segundo capítulo de esta publicación presenta información que le ayudará a aprovechar al máximo su mapa del sitio. Estas ideas incluyen:

  • Cómo encontrar páginas basura en su mapa de sitio.
  • Dónde encontrar páginas faltantes que quizás no haya incluido en su archivo de mapa del sitio.
  • Cómo alentar a Google a indexar más páginas de su mapa de sitio. 

Es muy recomendable que estudies detenidamente el segundo capitulo de esta publicación. Seguir estas prácticas recomendadas puede conducir a un proceso de rastreo e indexación más eficiente, lo que en última instancia puede aumentar la visibilidad de su sitio en Google.

Corregir errores de informes de Sitemaps

Una vez que envíe su mapa del sitio a Google, podrá ver si procesó correctamente el archivo en el Estado columna. Si su expediente sigue todas las reglas, su estado debería ser éxito. En este capítulo, analizaremos otros dos códigos de estado, a saber No se pudo recuperar y Tiene errores.

Google tiene problemas para rastrear su archivo de mapa del sitio

Comencemos con el escenario más difícil: Google no puede recuperar su archivo de mapa del sitio. Cuando esto sucede, es necesario utilizar el Herramienta de inspección de URL para encontrar la fuente del problema.

Captura de pantalla del informe Sitemaps de GSC

En Inspección de URL sección, haga clic en Prueba en vivo y verifique el estado de búsqueda de página. si dice Exitoso, debe haber un error por parte de Google. En este caso deberá contactar asistencia de Google

Cuando se comunique con el equipo de soporte de Google e informe el problema, proporcióneles detalles relevantes, incluida la URL del mapa del sitio, cualquier mensaje de error encontrado u observaciones que haya realizado. Google podrá ayudarle más y brindarle orientación para resolver el problema.

Captura de pantalla de la herramienta de inspección de URL de GSC

Si no hay ningún error por parte de Google y no se puede recuperar su mapa del sitio, asegúrese de que no haya nada que impida que Google acceda a su mapa del sitio. A veces, los culpables son las directivas robots.txt o incluso los complementos CMS. Además, asegúrese de haber ingresado una URL de mapa de sitio adecuada mientras presta atención al protocolo y www. 

Estas técnicas se pueden aplicar tanto a archivos de índice de mapas de sitio como únicos. Ahora, veamos cómo abordar algunos de los problemas más comunes de los mapas de sitios XML.

Errores en el archivo de índice del mapa del sitio

A veces, Google puede recuperar el archivo enviado y detectar errores. 

Al utilizar un archivo de índice de mapa de sitio, Google debe procesar todos los mapas de sitio separados que figuran en él para acceder a las URL de su sitio web. Si Google no procesa las URL que figuran en el archivo de índice del mapa del sitio, es posible que reciba una URL no válida en el archivo de índice del mapa del sitio error. Normalmente, esto significa que Google no puede encontrar uno o varios de sus mapas de sitio debido a URL incompletas o errores tipográficos. Todas las URL que apuntan a mapas de sitio individuales en su archivo de índice de mapa de sitio deben estar completamente calificadas, ya que de lo contrario Google no podrá encontrarlas. 

Además, su archivo de índice de mapa de sitio no debe incluir otros archivos de índice de mapa de sitio, solo mapas de sitio. Pero si los enumeras de todos modos, obtendrás un Formato de índice de mapa de sitio incorrecto: índices de mapa de sitio anidados error.

El último error que veremos es Demasiados mapas de sitio en el archivo de índice de mapas de sitio. Esto puede ocurrir cuando sitios web grandes enumeran más de 50,000 mapas de sitio en un solo archivo.

Errores de compresión y tamaño del mapa del sitio

Las restricciones de tamaño se aplican tanto a los archivos de índice de mapas del sitio como a los mapas de sitio individuales. El tamaño del archivo del mapa del sitio no debe exceder los 50 MB sin comprimir. El archivo tampoco debe incluir más de 50,000 URL de ubicación (sin contar las alternativas). Si no cumple con estas recomendaciones, obtendrá una Tamaño del archivo del mapa del sitio error. 

Al incluir versiones localizadas de páginas en su mapa del sitio, es importante comprender cómo cuenta Google las URL. De acuerdo a John Müller de Google, Google considera sólo el posiciones como URL individuales en un mapa del sitio. Esto significa que incluso si tiene varias posiciones xhtml:link para versiones en diferentes idiomas de una página, se contarán como una sola URL en términos de limitaciones de tamaño del mapa del sitio.

Otra cosa que debes tener en cuenta es que Google cuenta duplicados URL como una en mapas de sitio. Es posible que Google no considere esto como un error, pero aun así debes mantener tu mapa de sitio libre de duplicados. Esto se debe a que los duplicados no ayudarán a que su sitio web se indexe más rápido, pero sin duda agregarán desorden y pueden aumentar de manera redundante el tamaño del archivo del mapa del sitio.

Si bien su mapa del sitio no debería ser enorme, naturalmente tampoco debería estar vacío. Si envías un Mapa del sitio vacío, seguramente obtendrá un error.

Aprenda cómo dividir mapas de sitio en varios archivos leyendo nuestro guía definitiva de mapas del sitio.

Además, anteriormente en este artículo, mencionamos que el tamaño del mapa del sitio debe ser inferior a 50 MB cuando no está comprimido, pero es una práctica común comprimir los mapas del sitio para ahorrar ancho de banda. Una herramienta comúnmente utilizada para este propósito es gzip, que agrega la extensión gz a los mapas del sitio. Si recibe un error de compresión en el informe de Google Search Console, significa que algo salió mal durante el proceso de compresión. Lo mejor que puede hacer es intentarlo de nuevo.

Google tiene problemas para rastrear las URL de su mapa de sitio

Es posible que Google no pueda rastrear algunas de las URL que usted incluyó en su mapa del sitio por diferentes motivos. Echemos un vistazo a algunos de los más comunes.

  • El mapa del sitio contiene URL que están bloqueadas por robots.txt. Este El error es bastante claro, especialmente porque GSC le indicará cada URL bloqueada. Dependiendo de si deseas indexar estas URL, tendrás que levantar el bloqueo o eliminarlas de tu mapa del sitio.

Otros errores, como URL no accesibles, URL no seguidas, y URL no permitidas no son tan obvios. Repasemos brevemente cada uno de ellos.

  • El URL no accesibles El error significa que Google encontró su mapa del sitio en la ubicación designada pero no pudo recuperar algunas de las URL de su lista. Cuando esto suceda, utilice el Herramienta de inspección de URL. El procedimiento es el mismo que cuando Google no puede recuperar su mapa del sitio.
  • El URL no seguidas El error se produce porque utilizó URL relativas en su mapa del sitio en lugar de URL completas o simplemente debido a problemas de redireccionamiento. Algunas actividades que pueden provocar estos errores incluyen cadenas y bucles de redireccionamiento, redirecciones temporales utilizadas en lugar de redirecciones permanentes y redirecciones HTML y JS. 

    Intente no mantener las URL redirigidas en sus mapas de sitio XML durante más tiempo del necesario. Incluso John Mueller de Google ha insistido en este punto, mencionando en más de una ocasión que estas antiguas URL deberían incluirse temporalmente en lugar de a largo plazo. En un momento sugirió eliminarlos en menos de seis meses, pero en estos días de CFP. manteniéndolos en el mapa del sitio por no más de tres meses.

    Incluir URL redirigidas en el mapa del sitio es una estrategia útil, por supuesto, pero tiene un impacto general limitado. Es por eso que debe revisar y actualizar periódicamente su mapa de sitio XML para asegurarse de que incluya URL relevantes y actuales. Luego, duplique esto eliminando las URL redirigidas después del período de tiempo recomendado de uno a tres meses.

    Google Search Console no especificará la causa exacta del problema, por lo que tendrás que utilizar otras herramientas para determinar qué problemas deben solucionarse. Por ejemplo, Auditoría del sitio por ranking SE tiene un dedicado Redirecciones sección que te puede ayudar revisa tu sitio web para cualquier problema de redireccionamiento. 

    Si la herramienta encuentra algún problema, puedes acceder a toda la información necesaria sobre cada error haciendo clic en el número de páginas afectadas. Esto garantizará que sepa qué página presenta un error y cómo está vinculada a otras páginas del sitio web.

Captura de pantalla de la sección Redirecciones en la Auditoría del sitio web de SE Ranking
  • El URL no permitida El error indica que su mapa del sitio presenta URL en un nivel superior o en un dominio diferente al del archivo del mapa del sitio. Por ejemplo, si su mapa del sitio está ubicado en yoursite.com/category1/sitemap.xml y le ha agregado una página ubicada en yoursite.com/page1, Google no podrá acceder a esa página. 

    Hablando de diferentes dominios, tenga cuidado ya que Google trata HTTP y HTTPS, así como las versiones con y sin www de su sitio, como entidades distintas. Si recientemente cambió a HTTPS, asegúrese de generar un nuevo mapa del sitio con URL HTTPS.

    La herramienta de auditoría de sitios web de SE Ranking también le avisará cuando ocurran estos casos.

Captura de pantalla de la sección Seguridad del sitio web en la Auditoría del sitio web de SE Ranking
  • Finalmente, hay una cosa más que puede impedir que Google rastree una página: un código de estado HTTP distinto de 200. Este error está etiquetado como Error HTTP en el informe de Google Search Console y se especifica el código de error exacto para cada instancia. Puedes encontrar toda la información necesaria en el HTTP sección de Auditoría del sitio web de SE Ranking.
Captura de pantalla de la sección Código de estado HTTP en la auditoría del sitio web de SE Ranking

Google sospecha que has incluido las URL incorrectas

No incluya contenido ligero o páginas 404 suaves al administrar su mapa del sitio, ya que hacerlo puede afectar negativamente el SEO de su sitio web: 

  • Contenido delgado Se refiere a páginas que ofrecen contenido limitado o duplicado, aportando poco valor a los usuarios. Para abordar este problema, realice revisiones manuales y análisis de datos para identificar las páginas que carecen de sustancia o calidad. Por ejemplo, puede utilizar Google Analytics para detectar páginas con bajas tasas de participación y tráfico mínimo, ya que pueden ser candidatas a contenido reducido. Una vez identificadas, tiene tres opciones: no indexar estas páginas, mejorar su calidad modificando el contenido o eliminarlas por completo de su sitio web. 
  • Suave 404 páginas devuelve un código de estado "200 OK" en lugar de un estado "404 No encontrado", engañando tanto a los motores de búsqueda como a los usuarios. Para identificar estas páginas, vaya a Google Search Console Indexación de páginas informe, donde las páginas 404 blandas se enumerarán entre las páginas no indexadas por Google. Revise estas páginas detenidamente y tome las medidas adecuadas. Si la página realmente no existe, configure el estado de error 404 o 410 correcto para indicar su ausencia. Por otro lado, si la página existe y desea que Google la indexe, concéntrese en mejorar su contenido y luego vuelva a enviarla para su indexación.

Errores de mapas de sitio basados ​​en sintaxis

Por lo general, no tendrá que preocuparse por los errores de los mapas del sitio basados ​​en la sintaxis si genera un mapa del sitio con una de las herramientas especiales, ya que manejan las etiquetas y los atributos correctamente. Aún así, si creó su mapa del sitio manualmente, puede encontrar uno de los siguientes problemas: 

  • Valor de etiqueta no válido. El valor de la etiqueta es lo que se coloca entre la etiqueta de apertura y la de cierre, incluida la URL entre las etiquetas. <ubicación> etiquetas, y la fecha que indiques con la ayuda de etiqueta. Puede ocurrir un error cuando coloca un valor o formato de datos inaceptable en su mapa del sitio.
  • Valor de atributo no válido. El valor del atributo es lo que indicas después de un signo igual (=) entre comillas. Por ejemplo, la siguiente cadena de código enumera versiones en diferentes idiomas de una página en el mapa del sitio:
    https://ejemplo.com  

    Aquí, "alterno", "Gb" y “fr” son valores de atributos, pero "Gb" es el incorrecto porque no puedes indicar solo el código de país en hreflangs. En su lugar, debería combinarse con un código de idioma, como en “en-es”.

  • URL invalida. Este error sugiere que debería buscar errores tipográficos en las URL enumeradas. Asegúrese de que todas las URL de su mapa del sitio estén completamente calificadas.
    2005-02-21 
    2005-02-21T18:00:15+00:00
  • Falta atributo XML y Falta la etiqueta XML Los errores también son bastante claros. Omitir etiquetas y atributos obligatorios (conjunto de direcciones>, , , “xmlns”) no es una opción; debe enumerarlos para que su mapa del sitio funcione correctamente.
  • XML no válido: demasiadas etiquetas. Este error ocurriría si usa una de las etiquetas varias veces, por ejemplo, enumera dos ubicaciones de URL diferentes o dos fechas de modificación diferentes para una sola URL. Por lo tanto, tendrás que eliminar la etiqueta duplicada.
    <url>
    <loc>http://www.example.com/</loc>
    <lastmod>2021-01-01</lastmod>
    <lastmod>2021-02-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
    </url>
  • Espacio de nombres incorrecto. El espacio de nombres listado dentro de su La etiqueta debe ser uno de los protocolos aceptados. Actualmente se utilizan los siguientes protocolos:
Mapas del sitio de noticias xmlns:noticias=”http://www.google.com/schemas/sitemap-news/0.9″
Mapas de sitio de vídeo xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″
Mapas de sitios de imágenes xmlns:image:="http://www.google.com/schemas/sitemap-image/1.1"
mapas del sitio hreflang xhtml:hreflang:="http://www.w3.org/1999/xhtml"
  • Si utilizó el protocolo incorrecto para su mapa del sitio, obtendrá el Formato no compatible error. Este error también puede ocurrir debido a varios errores de sintaxis, como el uso de comillas incorrectas (solo se aceptan comillas simples o dobles) o la falta de la etiqueta de codificación.
Captura de pantalla del error de formato no compatible en GSC

También hay varios errores específicos del mapa del sitio de vídeo: La miniatura es demasiado grande/pequeña. La ubicación del video y la ubicación de la página de reproducción son las mismas. La URL de la ubicación del video parece ser una URL de la página de reproducción. Encuentre más detalles sobre estos errores esta página.

Para garantizar la precisión y la estructura adecuada de sus mapas de sitio XML, debe saber cómo evitar errores de sintaxis y errores comunes en los mapas de sitio. Una de las formas más convenientes de lograr esto es mediante el uso de validadores de mapas de sitio XML como esta. Herramientas como estas generarán un informe completo, resaltarán secciones o líneas de código problemáticas y le brindarán información valiosa sobre cómo corregir errores comunes en los mapas del sitio. 

Una vez que haya corregido todos los errores del mapa del sitio mencionados en su informe de GSC, vuelva a enviar su mapa del sitio actualizado y notificar a Google haciendo ping la URL actualizada del mapa del sitio. Envíe una solicitud GET a la siguiente dirección en su navegador o utilizando la línea de comando, especificando la URL completa del mapa del sitio:

https://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Esto garantizará que esté marcando activamente un cambio en el archivo del mapa del sitio, lo que hará que Google se dé cuenta y acelere el proceso de rastreo e indexación. 

Para conocer los entresijos de la indexación de sitios web, lea esto guía completa.

Equilibrio entre la proporción de URL enviadas y URL indexadas

El estado del archivo de índice de su mapa de sitio o de su mapa de sitio puede decir éxito, pero eso no significa que tu trabajo esté completo. Haga clic en el Ver indexación de páginas junto al número de URL descubiertas para ir al informe respectivo. Puede comenzar a investigarlo y descubrir que no todas las páginas que envió estaban indexadas. 

Captura de pantalla de la herramienta de indexación de páginas en Google Search Console

Al monitorear el estado de indexación de las páginas de su sitio web en Google Search Console, puede usar la función de filtro de mapa del sitio para cambiar fácilmente entre mapas de sitio y categorías de páginas.

Para acceder a esta función, navegue hasta el Indexación de páginas informe en Google Search Console, seleccione el filtro Mapa del sitio y luego elija la categoría o el mapa del sitio que desee examinar. Aquí es donde puede ver los siguientes informes:

  • Todas las páginas conocidas: incluye todas las páginas descubiertas por Google.
  • Páginas enviadas: enumera las páginas enviadas a través de su mapa del sitio
  • Páginas no enviadas: resalta las páginas que Google encontró pero que no fueron enviadas a través de su mapa del sitio.

Ahora bien, no sólo está bien sino que es común excluir páginas de la indexación. Esto se debe a que a Google no le pueden gustar ni indexar todas las páginas de su sitio web. Muchos sitios web tienen páginas que los webmasters no quieren indexar, como áreas de administración, páginas de utilidades, duplicados y páginas alternativas. Si Google no indexa sus páginas, probablemente se deba a que agregó páginas que no deberían estar en su mapa del sitio. Es posible que Google no pueda indexar ni rastrear la página debido a una directiva no indexada, o es posible que Google no esté seguro de si desea que la página se indexe o no, como cuando agrega páginas no canónicas a su mapa del sitio. Cada una de estas instancias se puede encontrar en diferentes pestañas de Google Search Console. Indexación de páginas informe, pero es más conveniente verificarlos utilizando la herramienta de auditoría del sitio web de SE Ranking, que mostrará cualquier problema de rastreo en el Crawling sección del informe de problemas.

Captura de pantalla de la sección de rastreo en la auditoría del sitio web de SE Ranking

Para resolver el problema de las páginas no indexadas, elimine las páginas no indexadas y no canónicas de su mapa del sitio. Alternativamente, si las páginas se marcaron como no indexadas y no canónicas por error, solucione los problemas de etiquetas incorrectas para permitir una indexación adecuada. 

Una vez que esté seguro de que su mapa del sitio no envía señales confusas a Google, consulte el Indexación de páginas informe para encontrar casos en los que usted y Google no estén de acuerdo sobre el valor de una página.

  • En Pestaña indexada, puede descubrir páginas que Google ha rastreado e indexado correctamente. Para acceder a esta lista, haga clic en Ver datos sobre páginas indexadas debajo del gráfico en la página de resumen del informe. Tenga en cuenta que este informe enumera solo 1,000 URL, por lo que es posible que no se incluyan todas las páginas. Para obtener datos más detallados sobre una URL específica, selecciónela de la lista o agréguela a la barra de búsqueda en la parte superior de la página y haga clic en Inspeccionar URL botón. Esto proporcionará información adicional sobre cómo Google percibe y trata esa URL.

    En la parte inferior de la página, encontrará el Mejorar la apariencia de la página sección, que presenta páginas indexadas que podrían beneficiarse de mejoras. Preste mucha atención a las páginas que fueron indexadas a pesar de tener una directiva noindex. En tales casos, el juicio de Google probablemente sea preciso y debería considerar eliminar la etiqueta noindex de estas páginas o revisar la configuración de la etiqueta X-Robots. Es posible que desee agregar estas páginas a su mapa del sitio, ya que Google cree que son de alta calidad. También debe tener cuidado con las páginas duplicadas que fueron indexadas pero que no están presentes en su mapa del sitio; estos casos a menudo surgen debido a una paginación y un manejo de parámetros deficientes. 

  • En No indexado pestaña, encontrará páginas que Google no pudo indexar por varias razones. Estos podrían incluir errores de indexación o exclusiones intencionales, como páginas bloqueadas por robots.txt, páginas 404 antiguas o páginas sin etiquetas canónicas o sin índice. 

    Los motivos por los que las URL no se indexan se enumeran en la Por qué las páginas no están indexadas tabla, que muestra el estado, la fuente y el número de páginas afectadas. Tómese el tiempo para revisar minuciosamente cada caso. Preste especial atención a las páginas canónicas que Google decidió no indexar, ya que el motor de búsqueda puede creer que existen mejores alternativas en su sitio web. Si la evaluación de Google es correcta, considere corregir sus etiquetas canónicas. Si aún cree que la página debería indexarse, concéntrese en mejorar su contenido, perfil de vínculo de retroceso y vínculos internos para convencer a Google de que es más valiosa que otras opciones.

    Después de resolver el problema, puede informar a Google y solicitar la validación de la solución haciendo clic en el botón proporcionado en el informe del problema. 

Se recomienda observar más de cerca todas estas páginas y luego ver qué puede hacer para aumentar su valor: trabajar en el contenido, la experiencia del usuario, los enlaces internos y más.

Conclusión

Crear un mapa del sitio es fácil gracias a la amplia variedad de herramientas de generación de mapas del sitio que existen en el mercado. Aún así, si simplemente se decide por cualquier herramienta aleatoria y luego ignora las mejores prácticas de mapeo de sitios, podría terminar enviando un montón de páginas de baja calidad a Google a través de su mapa de sitio.

Esperamos que esta guía te haya ayudado a corregir todos los errores en tu Google Search Console. Sitemaps informe. Recomendamos mantener únicamente páginas jugosas y de alta calidad en su mapa de sitio y eliminar todas las páginas que puedan dar una mala impresión en los motores de búsqueda. Si tiene alguna pregunta pendiente, no dude en comunicarse con nosotros a través de nuestro chat en vivo o ponerse en contacto con nosotros en Facebook.

punto_img

Información más reciente

punto_img