Skip to content

1491270550/xueqiu_spider_LQH_LZQ

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 

Repository files navigation

雪球网爬虫及情感分析报告

文件配置说明:

  1. 请下载“情报局”文件夹全部内容到本地,并
  2. 通过以下百度网盘链接下载Application文件夹,这是一个旧版本的Chrome浏览器,下载完成后将其放到情报局文件夹里(目录级别和pictures相同,即双击“情报局”后应当显示“Application”文件夹和“pictures”文件夹) 通过网盘分享的文件:Application 链接: https://pan.baidu.com/s/1cqatTqgIjU00UxjAWMP_6Q?pwd=1111 提取码: 1111
  3. 建议将“晴报局”文件夹完整移动至D盘或E盘下,路径如D:\情报局,并将“晴报局”重命名为全英文名称,如“LQH”,这时点击重命名后的文件夹中的xueqiu_auto.py文件运行,即可成功爬取数据!

运行前需要注意的事项⚠️

  1. 查看电脑分辨率是否为2560×1600,若不是,需要手动设置;(如果你电脑不存在2560×1600分辨率,可手动打开项目文件夹中的浏览器,窗口最大化后自行截图网址输入框(仿照pictures\1.png),截图命名为1.png并替换掉原本的1.png,即可在你电脑当前分辨率下正常运行)
  2. 运行程序前将电脑的输入法切换为英文输入法(中文输入法程序无法正常运行),没有安装英文版输入法的直接下载一个英文输入法即可,i.e. ENG英语(爱尔兰);
  3. 第一次运行前建议先打开文件夹中的谷歌浏览器,窗口最大化后关闭,再运行脚本;
  4. 确保所有安装包均已安装,第一次运行缺啥补啥,安装指令: pip install XXX i.e. pyautogui;
  5. 运行中很可能触发雪球网的反爬机制:滑动条验证。我让程序在此页面暂停,请用户手动完成滑动验证,并返回网页页面按下回车键(ENTER)继续爬取数据。

其他说明: 脚本实现对于用户输入的任意国内上市公司股票代码,一键爬取雪球网1500-2000条股票评论数据,用时约7分钟。生成6个本地文件,核心文件例如:SZ000010股票近期情绪分析报告.pdf、000010_output.csv(全部近期评论数据)


如有其他疑问,可咨询:1491270550@qq.com

作者:晴函和芷琪 时间:2025.3.26 当前职位:香港中文大学(深圳)会计学硕士 作品声明:仅供学习交流用途,除非经作者同意,严禁他人用于商业用途;请尊重作者的知识产权!

About

雪球爬虫 高效爬取近期沪深A股股票评论并自动生成PDF版情感分析报告

Topics

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages