Logotipo de Zephyrnet

La guía SEO para encontrar todas las páginas web de un sitio web

Fecha:

Gracias por suscribirse!

En el mundo del SEO, los datos son los reyes supremos. El acceso a él es crucial para tomar decisiones informadas y elaborar una estrategia exitosa para su proyecto. Para ganar este juego, debe concentrarse en dos cosas: mantenerse actualizado con el mercado y tener un conocimiento profundo de su sitio.

En este artículo, nos centraremos en conocer su sitio, ya que las mejores oportunidades y los peligros potenciales a veces acechan en los lugares más inesperados. Sin una lista completa de las páginas de su sitio web, corre el riesgo de perder valiosas oportunidades de mejora, lo que también significa perder una ventaja sobre sus competidores. 

Veamos algunas posibles razones por las que podría necesitar encontrar todas las páginas de un sitio web, qué herramientas lo ayudarán a hacerlo de manera efectiva y exactamente cómo.

¿Por qué necesito encontrar cada página?

Los motores de búsqueda introducen constantemente nuevos algoritmos y aplican penalizaciones manuales a páginas y sitios. Entonces, si no tiene una comprensión profunda de todas las páginas de su sitio web, está caminando de puntillas a través de un campo minado de SEO.

campo minado de SEO

Para evitar un contratiempo grave, debes estar atento a todas las páginas que componen tu sitio web. Si lo hace, no sólo le permitirá descubrir páginas que ya conocía, sino que también le ayudará a encontrar páginas olvidadas, páginas que no tenía idea de que existían y que de otro modo no podría ver.

Hay varios escenarios posibles cuando tienes que saber cómo encontrar todas las páginas web de un sitio, como por ejemplo:

  • Cambiar la arquitectura del sitio web
  • Mudarse a un nuevo dominio o cambiando la estructura de la URL
  • Encontrar páginas huérfanas
  • Encontrar páginas duplicadas
  • Encontrar 404 páginas
  • Creando redireccionamientos
  • Creando un sitio web archivo hreflang
  • Comprobación de etiquetas canónicas y no indexadas
  • Configuración de enlaces internos
  • Crear un mapa del sitio XML o un archivo robots.txt

Cómo encontrar todas las páginas de un sitio web

Ahora, cuando se trata de encontrar todas las páginas web que pertenecen a un solo sitio web, las siguientes opciones están disponibles:

  • Utilice la Auditoría de sitios web de SE Ranking para encontrar todas las páginas web rastreables.
  • Use Google Search Console para descubrir páginas que solo son visibles para Google. 
  • Utilice Google Analytics para detectar todas las páginas que alguna vez ha visitado.
  • Use las herramientas para webmasters de Bing para capturar páginas que solo son visibles para Bing. 
  • Descargue la lista de páginas del sitio web utilizando los comandos de la línea de comandos.
  • Extraiga las URL del sitio web de Sitemap.xml.
  • Ver todas las páginas de un sitio web a través de WordPress y otros complementos.

Exploremos cómo usar estas herramientas para escanear un sitio web en busca de todas las páginas.

Encontrar páginas rastreables a través de la auditoría del sitio web de SE Ranking

Comencemos recopilando todas las URL que tanto las personas como los rastreadores de motores de búsqueda pueden visitar siguiendo los enlaces internos de su sitio. El análisis de dichas páginas debe ser su principal prioridad, ya que reciben la mayor cantidad de atención.

Para hacer esto, primero necesitaremos acceder a SE Ranking, añadir un sitio web o seleccione uno existente y abra la pestaña Resumen en el Informe de auditoría del sitio web.

Acceder a la auditoría del sitio web en el ranking SE

Note: Los prueba gratuita de 14 días. le da acceso a todas las herramientas y funciones disponibles de SE Ranking, incluida la auditoría del sitio web.

A continuación, configuremos los ajustes para asegurarnos de que le estamos diciendo al rastreador que navegue por las páginas correctas. Para acceder a la configuración de Auditoría del sitio web, haga clic en el Equipo icono en la esquina superior derecha:

Acceso a la configuración de Auditoría del sitio web

En la configuración, ir a la Fuente de las páginas para la auditoría del sitio web y habilite el sistema para escanear Páginas del sitio, Subdominios, XML mapa del sitio para verificar que solo estamos escaneando lo que se ha especificado claramente y que estamos incluyendo los subdominios del sitio junto con todas sus páginas:

Acceso a la fuente de las páginas para la auditoría del sitio web

Luego ve a Reglas para escanear páginasy habilitar el Tener en cuenta las directivas de robots.txt opción para decirle al sistema que siga las instrucciones especificadas en el archivo robots.txt. Hacer clic 'Aplicar cambios' cuando termines:

Reglas de acceso para escanear páginas

Ahora, regrese a General de la pestaña. e inicie la auditoría con la nueva configuración aplicada presionando 'Reiniciar auditoría':

Reinicio de la auditoría del sitio web

Una vez finalizada la auditoría, vaya a Páginas rastreadas para ver la lista completa de todas las páginas rastreables:

Lista de páginas rastreadas en la auditoría del sitio web

Junto con una lista de todas las URL encontradas, verá todas las métricas esenciales de SEO del sitio, que incluyen:

  • Páginas de referencia: la cantidad de páginas en su sitio web que se vinculan a la URL específica. 
  • Número de errores en cada página.
  • Número de caracteres en la URL de la página.
  • Tipo y versión del protocolo URL.
  • Si la página está en el mapa del sitio.
  • Código de respuesta del servidor en la página.
  • Si la página está bloqueada por robots.txt.

Las métricas anteriores aparecerán como columnas predeterminadas en la pestaña Páginas rastreadas. Sin embargo, puede personalizar el informe para cumplir con sus requisitos específicos agregando otros parámetros. Simplemente vaya a la sección Columnas arriba de la tabla a la derecha y habilite o deshabilite cualquier métrica según lo desee.

Columnas de páginas rastreadas

Las páginas rastreadas se pueden ordenar por los errores, advertencias y avisos que contienen. Esto le permitirá priorizar páginas al solucionar problemas. También puede comparar informes una vez que haya auditado su sitio web al menos dos veces. Esto le ayuda a observar los cambios en las páginas rastreadas a lo largo del tiempo.

Comparación y clasificación de páginas rastreadas

También es posible utilizar filtros para ordenar las páginas según diferentes parámetros. Por ejemplo, si solo desea ver páginas de 200 códigos de estado, como aquellas que funcionan correctamente, agregue un filtro como este:

Ahora es el momento de exportar los resultados. Vaya a Exportar y elija guardar los datos en formato .xls o .csv.

Exportación de datos en Auditoría de sitios web

Encontrar todas las páginas a través de Google Search Console

Otra herramienta que puede utilizar para buscar todas las páginas de un sitio web es Google Búsqueda consola. Sin embargo, tenga en cuenta que GSC solo le mostrará las páginas a las que Google puede acceder.

Comience abriendo su cuenta y vaya a la pestaña Indexación. Elija el informe Páginas y seleccione "Todas las páginas conocidas" en lugar de "Todas las páginas enviadas".

Páginas en GSC

El cuadro verde etiquetado como "Indexado" le dará la cantidad de URL indexadas por Google. Haga clic en 'Ver datos sobre páginas indexadas' debajo del gráfico. Desde aquí, puede encontrar todas las URL en un dominio indexado por Google, así como la fecha de su último rastreo. Puede exportarlos en Hojas de cálculo de Google o descargarlos como archivos .xls o .csv.

Páginas indexadas en GSC

Ahora, volvamos a revisar las páginas no indexadas (páginas que no fueron indexadas y no aparecerán en Google). Prepárate para arremangarte y hacer mucho trabajo manual.

A medida que se desplaza hacia abajo, verá una lista de razones por las que algunas de las páginas de su sitio web no están indexadas.

Por qué Google no indexa las páginas

Puede ver diferentes categorías, como errores de redirección, páginas excluidas por la etiqueta 'noindex', aquellas bloqueadas por robots.txt, etc.

Al hacer clic en la categoría de error, verá una lista de las páginas afectadas. Revisar cada uno de ellos le dará acceso sin filtrar a cada página que Google haya descubierto en su sitio.

Páginas bloqueadas de la indexación en GSC

Otro informe útil en GSC para encontrar todas las páginas del sitio web es el informe Resultados de búsqueda. Este informe muestra todas las páginas que han recibido al menos una impresión en los resultados de búsqueda. Para acceder a él, vaya a Resultados de búsqueda en la pestaña Rendimiento, configure el período más grande posible y elija Páginas. Finalmente, exporte su informe.

Páginas que obtienen impresiones

También puedes utilizar la Análisis de búsqueda para hojas de cálculo complemento para recuperar datos de GSC a pedido y crear copias de seguridad automáticas en Hojas de cálculo de Google.

Encontrar todas las páginas con páginas vistas a través de Google Analytics

También puede encontrar todas las páginas del sitio web estudiando cuidadosamente los datos en su Cuenta de Google Analytics. Solo hay una condición: su sitio web debe estar vinculado a su cuenta de Google Analytics desde el principio, para que pueda recopilar datos entre bastidores.

La lógica aquí es simple: si alguien alguna vez visitó alguna página de su sitio web, Google Analytics tendrá los datos para probarlo. Y dado que estas visitas son realizadas por personas, debemos asegurarnos de que dichas páginas tengan un propósito distinto de SEO o marketing.

Comienza por ir a Informes → Compromiso → Páginas y pantallas y haga clic en Ruta de página y clase de pantalla.

Informe de páginas y pantallas en GA

También puede hacer clic en 'Puntos de vista' para que la flecha apunte hacia arriba y ordene las URL de la página de menor a mayor número de páginas vistas. En última instancia, las páginas menos visitadas se verán en la parte superior de la lista.

Luego, comparta o exporte los datos a un archivo .csv.

Encontrar todas las páginas del sitio web mediante las Herramientas para webmasters de Bing

Google se considera un gigante de las búsquedas, pero Bing sigue siendo uno de los motores de búsqueda más populares hasta la fecha. A partir de enero de 2023, su mercado de búsqueda global es 8.85%, haciendo correctamente optimizar su sitio web para Bing una estrategia inteligente. 

También puede utilizar las Herramientas para webmasters de Bing para encontrar todas las páginas de un sitio web indexadas por Bing. El proceso es sencillo, pero antes de comenzar, asegúrese de haber agregado y verificado su sitio web.

Una vez que su sitio esté configurado, vaya a Site Explorer en la barra de navegación de la izquierda y elija filtrar por 'Todas las URL'. El informe mostrará todas las páginas que Bing ve en su sitio. Haga clic en el botón Descargar para exportar los datos.

Paginas en Bing

Encontrar todas las páginas en un sitio web usando la línea de comando

Un enfoque más técnico para encontrar la lista de todas las páginas en un sitio web es usar la línea de comando. Este método implica interactuar con una computadora a través de comandos de texto. 

Para obtener todas las URL de un sitio web a través de la línea de comandos, primero deberá instalar Wget. Esta herramienta de línea de comandos le permite recuperar archivos de la web. El proceso de instalación varía según el sistema operativo que esté utilizando. Por ejemplo, macOS requiere que instale el brebaje casero administrador de paquetes antes de instalar herramientas de línea de comandos como Wget.

Para instalar Wget, abra una ventana de terminal y escriba el siguiente comando:

brew instalar wget

A continuación, descargue su sitio web. Ingresar:

wget -r www.sitioejemplo.com

Wget descargará su sitio web de forma recursiva. Comenzará con la página principal del sitio web y todas sus páginas vinculadas, imágenes y otros archivos. A partir de ahí, seguirá los enlaces en esas páginas y descargará las páginas a las que enlazan, y continuará este proceso hasta que haya descargado todo el sitio web.

Una vez que se descarga el sitio web, puede pedirle a Wget que enumere las URL escribiendo:

encontrar www.examplesite.com

Encontrar todas las páginas del sitio web a través de Sitemap.xml

XML mapa del sitio también es una excelente manera de encontrar todas las páginas de un sitio web porque proporciona una lista de todas las páginas que el propietario desea que los motores de búsqueda indexen. Funciona como una hoja de ruta, que guía a los robots de los motores de búsqueda a través de estructura del sitio y haciéndoles más fácil entender cómo está todo organizado.

Para obtener la lista, siga estos pasos:

  • Localiza tu mapa del sitio.

El mapa del sitio generalmente se puede encontrar en el directorio raíz del sitio web o escribiendo "/sitemap.xml" al final de la URL del sitio web, como en http://sitename.com/sitemap.xml. Si el sitio web tiene varios mapas de sitio, se enumerarán en el archivo de mapa de sitio principal, que normalmente se llama sitemap-index.xml. Aquí puede encontrar una lista de sitemaps y elegir el más relevante para obtener una lista de las páginas del sitio web.

  • Extraiga las URL de su mapa del sitio en Hojas de cálculo de Google. 

Aunque este es otro método con mucha tecnología, le ahorrará toneladas de tiempo y esfuerzo al importar todas las URL a Hojas de cálculo de Google en solo unos segundos. Sin embargo, primero deberá hacer un trabajo preparatorio. Comience creando una nueva hoja y luego vaya a Extensiones. A continuación, elija 'Apps Script'.

Extensiones de Hojas de cálculo de Google

Ahora deberá copiar y pegar el siguiente código JavaScript personalizado en el editor de secuencias de comandos para crear una nueva función:

function sitemap(sitemapUrl,namespace) { try { var xml = UrlFetchApp.fetch(sitemapUrl).getContentText(); var documento = XmlService.parse(xml); var root = document.getRootElement() var sitemapNameSpace = XmlService.getNamespace(namespace); var urls = root.getChildren('url', sitemapNameSpace) var locs = [] for (var i=0;i
Editor de secuencias de comandos en Hojas de cálculo de Google

Desde aquí, guarde y ejecute la prueba. El editor le pedirá permiso de acceso. Si la secuencia de comandos se implementa correctamente, no aparecerán mensajes de error. En su lugar, verá que la ejecución ha comenzado y finalizado.

Ejecutar nuevo script

Ahora puede volver a su Hoja de Google e ingresar la siguiente fórmula:

=mapadelsitio("URL del mapa del sitio","URL del espacio de nombres")

Una vez que haya localizado su mapa del sitio, debe tener a mano la URL del mapa del sitio, desde la cual puede copiar directamente la URL del espacio de nombres. En la captura de pantalla a continuación, puede ver cómo funciona esto con el mapa del sitio de SE Ranking:

  • La URL del mapa del sitio está en la barra de direcciones del navegador.
  • La URL del espacio de nombres está en la primera línea del contenido del mapa del sitio.
URL del mapa del sitio y del espacio de nombres

Copia estas direcciones y pégalas. como enlaces en la fórmula. Esto es lo que deberías obtener al final:

=mapa del sitio("https://seranking.com/sitemap.xml","http://www.google.com/schemas/sitemap/0.9")

Pegue esta fórmula en su hoja de Google y presione Entrar para obtener todas las URL extraídas de su mapa del sitio.

URL del sitio extraídas del mapa del sitio

Encontrar todas las páginas del sitio web a través de complementos de WordPress

Si su sitio web se ejecuta en WordPress, existen complementos que pueden ayudarlo a encontrar todas sus páginas. Las dos opciones más utilizadas son:

Para usar estos complementos, descárguelos e instálelos en su directorio '/wp-content/plugins/'. Una vez instalados, actívelos desde su página de Complementos en WordPress. Una vez que haya completado la activación, puede listar o exportar todas las URL de su sitio web.

Si utiliza un CMS diferente, verifique si tiene complementos incorporados para este propósito o si tiene uno separado en el directorio de extensiones. Por ejemplo, Joomla tiene muchos complementos para generar mapas de sitio para ayudarle a obtener una lista de las páginas del sitio web. Del mismo modo, Drupal tiene una módulo de mapa del sitio que puede ser útil al recopilar las páginas de su sitio.

Cómo ver todas las páginas de un sitio web en Google

Hemos discutido varias herramientas que pueden ayudarlo a encontrar todas las páginas de su sitio web, pero hemos dejado la opción más simple para el final, y por una buena razón. Si bien este método es el más fácil, debe tener cuidado al usarlo. 

Busca tu sitio en Google, pero hazlo bien. Esto significa usar Operadores de búsqueda de Google, que son comandos especiales que refinan la búsqueda en función de criterios establecidos.

Simplemente vaya a la Búsqueda de Google y escriba “sitio:nombre del sitio web” como en “sitio:seranking.com”. No necesitará agregar http:// o www, pero asegúrese de que no haya espacios entre el operador y la consulta; de lo contrario, los resultados serán incorrectos.

Páginas del sitio web en Google

Aún así, debe considerar que este comando no fue creado para mostrar todas las páginas indexadas en su sitio, a las cuales John Mueller de Google confirmado.

John Mueller
Defensor de la búsqueda en Google
La respuesta corta es que una consulta site: no está destinada a ser completa, ni se utiliza con fines de diagnóstico... Esta consulta limita los resultados a un sitio web específico. No pretende ser una colección completa de todas las páginas de ese sitio web.
Dar clic aquí para compartir

Un último consejo es usar Google Search Console, pero de una manera ligeramente diferente a la explicada en secciones anteriores. Concéntrese en las impresiones de la página (la cantidad de veces que se mostró la página en la búsqueda) pero por un corto período de tiempo; como siete días, por ejemplo.

Pensamientos de cierre

Ubicar todas las páginas de su sitio web es crucial para mejorar su SEO y sirve como el paso inicial hacia más actividades de optimización. Con estos datos, puede identificar las páginas que requieren mejoras, actualizar el contenido desactualizado, encontrar todos los enlaces de sitios web y reparar los que no funcionan, y optimizar su estructura de enlaces internos en general.

Al utilizar las herramientas y los métodos descritos en este artículo, puede descubrir rápidamente todas las páginas de su sitio web y obtener información valiosa sobre su rendimiento. Por lo tanto, tómese un breve momento para compilar una lista de páginas para estar al tanto de sus esfuerzos de marketing y SEO. Tómalo del equipo de SE Ranking: no te llevará mucho tiempo cuando utilices nuestras herramientas.

punto_img

Información más reciente

punto_img