Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Desacoplar los scraper de la build del sitio #15

Open
AngelGuerra opened this issue Feb 6, 2020 · 3 comments
Open

Desacoplar los scraper de la build del sitio #15

AngelGuerra opened this issue Feb 6, 2020 · 3 comments
Labels
propuesta This will not be worked on

Comments

@AngelGuerra
Copy link
Contributor

Ahora mismo el build es el que se encarga de hacer el scraping y formar la web. Molaría que el scraper se haga en algún otro momento, genere algún tipo de archivo (json, toml, yaml...) y que el build tire de ese archivo, con ello se conseguiría:

  • Histórico de noticias (o cualquier otra cosa que haga scraping)
  • Menos consumo en Netlify por tanto, más margen para aumentar los deploys
@ardillan ardillan added the propuesta This will not be worked on label Feb 7, 2020
@ardillan
Copy link
Owner

ardillan commented Feb 7, 2020

Sería genial poder hacer eso. ¿Alguna idea de con qué herramienta se puede realizar?

Hace unos días estuve probando oclif, no sé si podría ser un buen candidato para desacoplar el scraper de la web, ¿qué opinas?

@AngelGuerra
Copy link
Contributor Author

Uoh, qué agradable coincidencia, yo también estuve trasteando con oclif hace nada.

Al margen de la herramienta de programación, lo que hay que pensar más es en la comunicación entre el scraper y el build de Gatsby.

Quizá mezclando las GitHub actions con llamadas específicas para hacer el build de Netlify (webhooks?), hay que pensarlo.

@AngelGuerra
Copy link
Contributor Author

Leyendo un poco me ha dado una idea más o menos formada, pero habría que probarlo:

El scraper se mete en un repo propio y con GitHub Actions, se genera un archivo Json (yaml, toml...) y se hace push con el Json generado (quizá a un nuevo repo llamado torlavegadata) en el que se empujarán todos los archivos con los data estáticos.

Este repo torlavegadata puede ser un paquete de node o un submódulo de GIT que se incluirá en el package del GatsbyJS (o si es submódulo se clona).

Con esto, al hacer npm i se traerán los datos estáticos.

En este artículo explica parte de lo que he comentado.

Quedaría lanzar la CI de GitHub de manera programada sin hacer push (webhooks?) y que no haya que lanzarlo a mano.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
propuesta This will not be worked on
Projects
None yet
Development

No branches or pull requests

2 participants