Vamos con nuestro segundo artículo de esta serie que da algunos ejemplos prácticos de cómo utilizar los recursos de Google Sheets para hacer SEO y no depender tanto de algunas herramientas.

Si has leído el primer artículo, en el que hablo sobre el uso de Google Sheets para validaciones técnicas de SEO, comenté algunos ejemplos de cómo podríamos aplicar la fórmula IMPORTXML y uno de ellos era la cuestión de extraer datos de un XML (además de una página HTML estándar).

En este caso, la idea es la misma. Pasamos qué URL queremos obtener información y en el parámetro siguiente, qué XPath corresponde a esa información. Lo que seguirá una estructura similar a esta fórmula en Google Sheets:
formula-google-sheets.png

Solo con esta estructura ya devuelve una lista con todas las URLs presentes en el Sitemap XML indicado. Pero atención, dependiendo del tamaño del archivo que consultes (hasta cerca de 1.000 URLs esta estructura aguanta bien), pueden ocurrir algunos errores y quizás tengas que solucionarlo usando algún script que haga esta petición progresivamente.

Como comenté, puedes hacer estas mismas extracciones mediante otros softwares de SEO o scripts personalizados, pero el enfoque aquí es utilizando Google Sheets. Si tienes un volumen alto de páginas listadas, softwares como Screaming Frog Spider pueden ser la mejor alternativa al permitir que importes las URLs mediante una URL de Sitemap.

XPath del en un Sitemap XML

El secreto para extraer las URLs está en cómo usas el XPath. En la época que investigué para hacer esta consulta en las URLs, encontré varios ejemplos, pero el XPath que realmente funcionó fue el siguiente: //[local-name() =’url’]/[local-name() =’loc’]»).

Y aplicándolo en un ejemplo práctico:
formula-google-sheets-2.png

¿Recuerdas el consejo de las comillas simples del otro artículo? Pues no te olvides de él aquí.

Y para facilitar, he dejado una hoja de cálculo de ejemplo para que hagas una copia y pruebes con un ejemplo real.
planilha-exemplo-seo-xml-google-sheets.png
Hoja de cálculo de ejemplo con el XPath para localizar las URLs de un Sitemap XML

Obteniendo otra información

Lo bueno del XPath del ejemplo anterior es que puede adaptarse fácilmente para obtener otra información dentro de un XML. Por ejemplo, si tuviese el siguiente código en un Sitemap XML:
formula-google-sheets-3.png

Y quisiera obtener el valor de la fecha de la última modificación representada por , solo sería cambiar el loc por lastmod en nuestro XPath:
formula-google-sheets-4.png

Fácil, ¿verdad? Solo cambiar el loc por lastmod. Aprovecha el modelo que he puesto aquí y haz la prueba con otra información de un sitemap de tu sitio.

Otras ideas con XML

En los párrafos anteriores he seguido una línea de razonamiento sobre un archivo XML estándar que comúnmente se utiliza en SEO. Pero nada te impide aplicar esto en otros archivos XML como:

  • Sitemap de Índice.
  • XML de Google Shopping.
  • XML de algún agregador como Buscapé.
  • Mapear las URLs del competidor (muchas plataformas dejan las URLs de estos archivos en una dirección estándar o dentro del robots.txt).

Otros escenarios en que esto es útil

Ya he vivido algunos proyectos en los que había mucha dificultad (o incluso no había el recurso) para extraer determinados informes con las URLs del sitio y muchas veces el sitio solo tenía un XML de Google Shopping. Lo que acababa siendo la salvación, pues viene con información adicional y era muy útil cuando quería obtener información adicional sobre la URL (ej: como la categoría con un nombre amigable).

También puedes utilizarlo en casos de migración, como una forma de verificar si todas las URLs están presentes en tu planificación de redirecciones.

Y sobre esta hoja de cálculo de ejemplo de este artículo, puedes avanzar más y obtener información como:

  • Código de estado de las páginas del XML (si presenta algún error o redirección).
  • Usar otro IMPORTXML para obtener otra información dentro de esas páginas (ej: el title y description).
  • Evaluar las métricas relacionadas con la página (haciendo un BUSCARV en un informe de Google Analytics o de Google Search Console).
  • Esta última puede ayudarte bastante a priorizar algunas actividades y evaluar si hay algún error en tu archivo.

Y entonces, ¿qué te ha parecido esta aplicación para el IMPORTXML? No dejes de comentar si este ejemplo te ha sido útil y compartir tu experiencia si la has utilizado para algún otro caso.