WordPress API Rest + Google Sheets
Oh my sheets! Cómo extraer el contenido de un sitio creado con WordPress
Hola,
Hoy no me enrollo mucho que ayer ya le dediqué un largo espacio de mi escaso – y preciado – tiempo al script protagonista de esta edición.
Por supuesto va de API. Concretamente la API Rest de WordPress. Y tengo que decir que es una auténtica maravilla. Qué grandísimo aporte cuando en su versión 4.4, allá por 2015 se incluyó esta capacidad.
La cantidad de cosas que puedes hacer con ella: desde conectar app / webapp / SaaS para obtener o crear contenido en WordPress hasta crear una versión estática de un sitio web. Se me ocurren mil ideas. ¿A ti no? Si a ti también se te ocurren ideas pero te falta un empujón para ponerlas en marcha, cuéntamelas respondiendo a este correo o con un DM en tuiter o como prefieras… yo encantado de echarte un cable (-:
Otra cosa que me alucinó fue la incorporación en el Core de WordPress la funcionalidad para generar y revocar tokens y así autenticar las peticiones a la API a partir de la versión 5.6 de WordPress. Vamos, lo que antes venía haciéndose con el fantástico plugin Application Password pero a partir de ahora, de serie en WordPress.
Llegados a este punto, un par de apuntes interesantes:
Si no utilizas la API Rest de WordPress o estás 100% seguro de que ningún plugin instalado hace uso, puedes desactivarla. Así les pondrás un pelín más difícil el “raspado” de tus contenidos. Puedes hacerlo desde functions.php o con plugins.
Recuerda que si tu sitio no dispone de certificado SSL y no sirves las páginas con https, la función de Contraseñas de aplicaciones no se habilita por razones obvias de seguridad. Como por ejemplo, en un entorno local. Si aún así quisieras activar la funcionalidad para testearla, pues podrás utilizar el siguiente código en functions.php
WP API Rest Extractor v 1.0
Aunque está todo un poco “a pelo”, te dejo con esta idea loca que te permite realizar una llamada a un sitio web creado con WordPress que tenga la API expuesta publicamente – casi todos los sitios… – para sacar todos los post publicados con su título, url, fecha de publicación y fecha de modificación.
Y esto es solo el principio. Además, podrías sacar las páginas, categorías, etiquetas, otros CPTS y todo aquello que, como digo, esté publicamente disponible.
Si quieres ver lo que hace el script, aquí tienes el tuit. Si quieres hacerte una copia de la hoja y ponerlo en marcha, haz clic aquí para copiar la hoja.
📂 Otros enlaces
Consigue 10$ de saldo registrándote en Webautomatio.io, un pedazo de herramienta para hacer scraping NO-CODE de sitios como Amazon, Idealista o Google Maps. Puedes suscribirte a un plan mensual o comprar paquetes de crédito sueltos.
Tengo que decir que me compré BotStar y está de maravilla en comparación a los videos que había visto hace un año cuando la lanzaron por primera vez. Y ahora resulta que los mamones amplian oferta lifetime hasta el 3 de marzo. Yo me lo miraba…
Por cierto, te dejo por aquí el envío anterior porque los amigues de Substack no quisieron enviarlo a los suscriptores.