本人准备外出实习,然后就需要租房,然后就想到了查一下网上的租房信息,不知道怎么的就看到链家这个网站,然后顺势就进行一波基本信息的爬取,然后进行一些简单的分析,以方便自己找房子租😁欢迎大家一起讨论租房的东西
scrapy
分析的部分内容在“对链家租房爬取的数据进行探索性数据分析.ipynb”,因为使用pyechart生成的图表没办法导出成markdown,所以我就把生成的图片导出展示在下方,下面的数据都是2019年6月进行爬取的。😀
爬取下来的这些数据其实还有很多东西可以处理的,比如对房价和时间的关系用机器学习算法进行建模预测未来的变化,还有可以建模价格和哪些关键因素影响更大等。