Skip to content

Latest commit

 

History

History
40 lines (30 loc) · 2.01 KB

README.md

File metadata and controls

40 lines (30 loc) · 2.01 KB

Raspando Dados Da Internet Com Python

Python Brasil 2023 - 31 / 10 / 2023

Sobre o tutorial

A informação é abundante e está facilmente disponível na Internet. No entanto, a enorme quantidade de dados pode ser esmagadora e demorada para navegar. É aí que entra a raspagem de dados - uma ferramenta poderosa usada para extrair dados de sites e transformá-los em um formato utilizável.

Neste tutorial, exploraremos os fundamentos de raspagem de dados e como implementá-los usando Scrapy (um framework Python). Quer você seja um analista de dados, programador ou pesquisador, este tutorial irá equipá-lo com as habilidades fundamentais necessárias para criar seu próprio raspador e extrair informações valiosas de sites.

Antes do tutorial

Clone este repositório para ter acesso à apresentação e também à solução do código dos exercícios sugeridos: https://github.com/rennerocha/pybr2023-tutorial

Durante o tutorial espera-se que você tente resolver alguns pequenos exercícios usando Scrapy, um framework de web scraping. Será a única biblioteca necessária para ser instalada (quaisquer outras dependências deverão ser instaladas junto com ela).

Siga o guia de instalação do Scrapy de acordo com sua plataforma e certifique-se de que você consegue executar a versão do scrapy em seu terminal e veja Scrapy 2.11.0 como resultado (sem erros).

Na plataforma Linux sugiro a utilização de um ambiente virtual. Se tudo estiver certo, só será necessário executar alguns comandos para ter tudo funcionando e pronto para utilização:

$ git clone https://github.com/rennerocha/pybr2023-tutorial.git tutorial
$ cd tutorial
$ python3 -m venv .venv
$ source .venv/bin/activate
$ cd code
$ python -m pip install -r requirements

Em outras plataformas, siga a documentação oficial do Scrapy com o guia de instatlação