Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于异常反馈和优化建议 #22

Open
JoeanAmier opened this issue Jul 4, 2023 · 12 comments
Open

关于异常反馈和优化建议 #22

JoeanAmier opened this issue Jul 4, 2023 · 12 comments
Assignees
Labels
文档补充(docs) 文档补充说明

Comments

@JoeanAmier
Copy link
Owner

JoeanAmier commented Jul 4, 2023

异常反馈

建议仔细阅读 README.mdDocumentation 了解项目使用方法和功能介绍,如果遇到无法解决的问题,可以创建 issue 寻求解决方案,或者 加入群聊 进行问题反馈。

建议在 issue 中提交以下信息:

  • 发生异常时程序的运行模式
  • 发生异常时所用的链接
  • 程序运行日志文件或部分日志内容
  • 发生问题时的错误代码
  • 程序源码的版本号
  • Python 版本号
  • 其他必要说明

优化建议

可以创建 issue 描述你认为较为实用的建议或优化方案,或者 加入群聊 进行讨论交流。

作者会优先考虑需求量大或者实用性高的优化建议!

@JoeanAmier JoeanAmier added the 文档补充(docs) 文档补充说明 label Jul 4, 2023
@JoeanAmier JoeanAmier self-assigned this Jul 4, 2023
@JoeanAmier JoeanAmier pinned this issue Jul 4, 2023
@JoeanAmier JoeanAmier unpinned this issue Jul 5, 2023
@JoeanAmier JoeanAmier pinned this issue Jul 31, 2023
@wangyi1573
Copy link

抖音分享的链接 无法获取到数据,例如:https://www.iesdouyin.com/share/video/7274129170744020284
需要将地址改造成如下的地址才可以https://www.douyin.com/video/7274129170744020284

@JoeanAmier
Copy link
Owner Author

抖音分享的链接 无法获取到数据,例如:https://www.iesdouyin.com/share/video/7274129170744020284 需要将地址改造成如下的地址才可以https://www.douyin.com/video/7274129170744020284

第一个链接是怎么拿到的?

@wangyi1573
Copy link

我就在抖音的分享那点击复制URL得到的分享链接,多数时候得到是:https://v.douyin.com/**的短链接,那个链接不知道是什么情况下会给

@JoeanAmier
Copy link
Owner Author

我就在抖音的分享那点击复制URL得到的分享链接,多数时候得到是:https://v.douyin.com/**的短链接,那个链接不知道是什么情况下会给

一般分享按钮拿到的链接都是 v.douyin,这种分享链接是支持的。

@wangyi1573
Copy link

昨天重现了,是分享按钮显示绿色的wechat图标时拿到的就是:[https://www.iesdouyin.com/share/video/***的链接

@vvyoko
Copy link

vvyoko commented Nov 26, 2023

批量下载账号 获取每一页数据时能不能检测下最后一条(最老)数据是否存在于 数据库中?
如存在则不继续抓取后续的页码减少请求,直接使用数据库中的数据?

@JoeanAmier
Copy link
Owner Author

批量下载账号 获取每一页数据时能不能检测下最后一条(最老)数据是否存在于 数据库中? 如存在则不继续抓取后续的页码减少请求,直接使用数据库中的数据?

目前可以使用参数限制请求次数。

@vvyoko
Copy link

vvyoko commented Nov 26, 2023

@JoeanAmier
不是请求次数,限制请求它还是会遍历吧.
或者说限制页数,限制页数可能会有未完全下载,或不知道限制多少页的问题

每次更新的时候都会遍历所有页数.作品较多的非常耗时
第一次已经加载完所有数据了,并存入数据库了

后续更新再请求所有页面完全没必要呀,它已经存在于数据库中了
页数在前面的都是最新的
判断一下每一页最后一个存在于数据库中时后续的用数据库的内容就行了
这种情况下后续更新一般只要抓取一两页就够了

@vvyoko
Copy link

vvyoko commented Nov 26, 2023

刚想了下,可能是想简单了,文案之类的可能没变,但可能链接会变...
唉,可能还得自己来想办法
TikTokDownload是抓取一页下载一页
要临时中断还挺容易的

本脚本是一次性抓取所有页,对python也不熟悉
我得看看怎么样在抓取一页后临时加个判断,看看ID是否存在于IDRecorder.txt中.
存在多次就代表已经下载到历史位置了
可能还得反转抓取数据,从最老的开始下...

@JoeanAmier
Copy link
Owner Author

@JoeanAmier 不是请求次数,限制请求它还是会遍历吧. 或者说限制页数,限制页数可能会有未完全下载,或不知道限制多少页的问题

每次更新的时候都会遍历所有页数.作品较多的非常耗时 第一次已经加载完所有数据了,并存入数据库了

后续更新再请求所有页面完全没必要呀,它已经存在于数据库中了 页数在前面的都是最新的 判断一下每一页最后一个存在于数据库中时后续的用数据库的内容就行了 这种情况下后续更新一般只要抓取一两页就够了

不是所有人都使用数据库格式储存数据;如果设置了发布日期限制,早于该日期的数据不会请求获取;如果有定制需求,建议二次开发。

@15913616879
Copy link

下载评论的时候是先下载所有一级评论再下载二级评论,这样会打破阅读顺序,可以优化为顺序下载或者下载后重排顺序

@fzweclipse
Copy link

用户搜索的结果和界面显示的不一样。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
文档补充(docs) 文档补充说明
Projects
None yet
Development

No branches or pull requests

5 participants