-
-
Notifications
You must be signed in to change notification settings - Fork 382
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Manutenção] Camaquã-RS #1038
Comments
@trevineju, pelo que vi, esse novo site publicador tem Diários a partir de 05/01/2022. Lembrando que Em uma olhada rápida, a estrutura é similar entre Gravataí e Campo Mourão (que é diferente de Camaquã). |
Esta PR... - informa que Camaquã-RS está com a série interrompida: okfn-brasil/querido-diario#1038 - retira 3 cidades: okfn-brasil/querido-diario#1034 - adiciona 9 cidades: okfn-brasil/querido-diario#1028 okfn-brasil/querido-diario#1032 okfn-brasil/querido-diario#1036
Sistema replicável 'Atende' (layout Tipo 1). Resolve okfn-brasil#1038 Conforme comentado em okfn-brasil#1038 (comment) esse novo spider coleta apenas da edição 333 em diante. Como falta a informação de data para muitas edições na página, a estratégia foi incluir a verificação do número da edição para limitar o download dos arquivos e salvar a data `datetime.date.max` nos metadados para que a etapa de 'data processing' realize a extração dessa informação.
original de Camaquã, para refletir o último dia antes da publicação da edição 333 no novo site atende.net Ajuste associado à issue okfn-brasil#1038
O raspador para Camaquã-RS não está mais funcionando pois o site publicador mudou.
O novo site publicador é https://camaqua.atende.net/cidadao/pagina/diario-oficial
Faltam muitos metadados nesse site novo, vamos precisar avaliar o que fazer neste caso
The text was updated successfully, but these errors were encountered: