-
-
Notifications
You must be signed in to change notification settings - Fork 382
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Adicionar extensão ao arquivo baixado #819
Labels
type: enhancement
Novo recurso ou ferramenta
type: production
Esse problema afeta o que está em produção
Comments
@Winzen essa issue pode ficar com vc? |
5 tasks
Pr feito @trevineju 🕺 |
5 tasks
AlexJBSilva
added a commit
to AlexJBSilva/querido-diario
that referenced
this issue
Nov 30, 2023
está sendo baixado, quando o scrapy não consegue achar a extensão pela url de download. Essa parte é uma implementação (com ajustes) do código sugerido pelo @ogecece em okfn-brasil#946 (review) . Para resolver o problema de "nos casos onde forçamos a detecção da extensão, o arquivo sempre seria baixado novamente de forma desnecessária", o método `stat_file` foi sobrescrito, com a inclusão da busca por um arquivo com extensão quando o scrapy não consegue achar a extensão pela url de download para comparar se o arquivo já foi baixado. Resolve okfn-brasil#819
5 tasks
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Labels
type: enhancement
Novo recurso ou ferramenta
type: production
Esse problema afeta o que está em produção
Os arquivos baixados durante a raspagem às vezes estão sem extensão.
Isso prejudica quem estiver contribuindo com desenvolvimento e teste de raspadores em Windows.
Além disso, como os arquivos entram na infra do projeto assim, faz com que, na ponta (plataforma web) seu download também fique sem extensão (em "baixar o arquivo original") e portanto sem abrir em computadores Windows (que deve ser majoritária parte do público usuário do Querido Diário).
Assim, é uma limitação que prejudica usuários no front, mas que começa na etapa de raspagem potencialmente limitando desenvolvedores também.
Tarefa:
Implementar uma correção para que a extensão PDF seja adicionada automaticamente
The text was updated successfully, but these errors were encountered: