文件配置说明:
- 请下载“情报局”文件夹全部内容到本地,并
- 通过以下百度网盘链接下载Application文件夹,这是一个旧版本的Chrome浏览器,下载完成后将其放到情报局文件夹里(目录级别和pictures相同,即双击“情报局”后应当显示“Application”文件夹和“pictures”文件夹) 通过网盘分享的文件:Application 链接: https://pan.baidu.com/s/1cqatTqgIjU00UxjAWMP_6Q?pwd=1111 提取码: 1111
- 建议将“晴报局”文件夹完整移动至D盘或E盘下,路径如D:\情报局,并将“晴报局”重命名为全英文名称,如“LQH”,这时点击重命名后的文件夹中的xueqiu_auto.py文件运行,即可成功爬取数据!
运行前需要注意的事项
- 查看电脑分辨率是否为2560×1600,若不是,需要手动设置;(如果你电脑不存在2560×1600分辨率,可手动打开项目文件夹中的浏览器,窗口最大化后自行截图网址输入框(仿照pictures\1.png),截图命名为1.png并替换掉原本的1.png,即可在你电脑当前分辨率下正常运行)
- 运行程序前将电脑的输入法切换为英文输入法(中文输入法程序无法正常运行),没有安装英文版输入法的直接下载一个英文输入法即可,i.e. ENG英语(爱尔兰);
- 第一次运行前建议先打开文件夹中的谷歌浏览器,窗口最大化后关闭,再运行脚本;
- 确保所有安装包均已安装,第一次运行缺啥补啥,安装指令: pip install XXX i.e. pyautogui;
- 运行中很可能触发雪球网的反爬机制:滑动条验证。我让程序在此页面暂停,请用户手动完成滑动验证,并返回网页页面按下回车键(ENTER)继续爬取数据。
其他说明: 脚本实现对于用户输入的任意国内上市公司股票代码,一键爬取雪球网1500-2000条股票评论数据,用时约7分钟。生成6个本地文件,核心文件例如:SZ000010股票近期情绪分析报告.pdf、000010_output.csv(全部近期评论数据)
如有其他疑问,可咨询:1491270550@qq.com
作者:晴函和芷琪 时间:2025.3.26 当前职位:香港中文大学(深圳)会计学硕士 作品声明:仅供学习交流用途,除非经作者同意,严禁他人用于商业用途;请尊重作者的知识产权!