本代码是大创期间所作,当时发现网上资料很少,我深深体会到摸着石头过河是什么感觉,因此现在将其分享出来。
代码只是基本实现了我本人的需求,类似于解耦、封装等优化我是一点都没做的。
而且词频统计也不完美,如果有能力的话,可以进行完善。
- TWINT 用于推特爬虫 https://github.com/twintproject/twint
- NLTK 用于自然语言处理 https://github.com/nltk/nltk
- PyMySQL 用于操作数据库
本代码是大创期间所作,当时发现网上资料很少,我深深体会到摸着石头过河是什么感觉,因此现在将其分享出来。
代码只是基本实现了我本人的需求,类似于解耦、封装等优化我是一点都没做的。
而且词频统计也不完美,如果有能力的话,可以进行完善。