Skip to content

AlexYangLong/SimpleSpiders

Repository files navigation

BQK-novel-spider、MMjpg-spider、QSBK-spider、JS-spider、TXSZ-spider、NHDZ-spider是基于Python3.x、requests库、bs4库,urllib-text使用的Python的内置库,scrapy01是基于Python3.x、scrapy框架、bs4库

Lagou-spider 目前爬取详情页时有一点问题

Weather-spider 爬取中国天气网,并将温度最高的10座城市数据可视化

Doutu-spider 爬取斗图网上的表情包(简单使用了多线程)

JRTT-spider 爬取今日头条 街拍的图片(简单使用了多进程的进程池)

MYDY-spider 爬取猫眼电影top100电影信息(简单使用了多进程的进程池)

user_agent.py 中存放的是一些请求头中User-Agent

About

Some simple spiders are written by python.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages