Skip to content

使用scrapy编写的爬取链家的租房信息的爬虫,然后还有对数据集的探索性数据分析,以探索租房的特点😁方便自己研究新城市中住处的寻找。

License

realzhengyiming/lianjiaSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

爬取链家租房信息

本人准备外出实习,然后就需要租房,然后就想到了查一下网上的租房信息,不知道怎么的就看到链家这个网站,然后顺势就进行一波基本信息的爬取,然后进行一些简单的分析,以方便自己找房子租😁欢迎大家一起讨论租房的东西

requirement

scrapy

文档内容

分析的部分内容在“对链家租房爬取的数据进行探索性数据分析.ipynb”,因为使用pyechart生成的图表没办法导出成markdown,所以我就把生成的图片导出展示在下方,下面的数据都是2019年6月进行爬取的。😀

数据分析最终结果做成可视化如下图所示:

1.租房中各种房型的所占比例

2.爬取的数据中各城市的租房信息数量

3.房屋朝向最多的前10个朝向

4.价格和面积的关系

5.各城市租房的均值

6.租房价格均值漏斗图

7.深圳和广州中租房价格2000元以下

8.2000元以下的合租房的比

9.按年份来查看租房价格均值的变化

10.按季度来查看租房价格均值的变化

11.按月份来查看租房价格均值的变化

12.按年份来查看租房价格均值的变化

13.广州的租房价格按季度来查看租房价格均值的变化

14.广州按月份来查看租房价格均值的变化

15.广州按周来查看租房价格均值的变化

TODO

​ 爬取下来的这些数据其实还有很多东西可以处理的,比如对房价和时间的关系用机器学习算法进行建模预测未来的变化,还有可以建模价格和哪些关键因素影响更大等。

About

使用scrapy编写的爬取链家的租房信息的爬虫,然后还有对数据集的探索性数据分析,以探索租房的特点😁方便自己研究新城市中住处的寻找。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published