-
Notifications
You must be signed in to change notification settings - Fork 232
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
支持Yi-1.5系列Chat模型 #698
Comments
看起来是卡在了加载数据阶段,是用的 HF Hub 上的开源数据么?如果是的话,可能是因为网络原因 @thomas-yanxin |
不是的,本地数据。 |
那可能要检查数据加载环节是不是出问题了,可以用 同时,可以用 alpaca 数据看下是否能正常训练 |
应该不是数据的问题。用同样的数据,其他模型也可以正常训练。 |
从 log 上看,确实是卡在了数据加载的阶段,还没有加载开始加载模型,应该和模型关系不大 可能是因为你的数据量太大了? |
我可能会觉得不是这个问题。 我先解释一下我的任务:我在执行一个LLaVA-Yi的任务。然后在Pretrain阶段,我只使用了20w的数据。这个量应该还好。 |
@thomas-yanxin 20w 还好不是很多。你可以考虑先离线化,这样应该更容易判断是否是数据集问题。我跑过了 yi 1.5 34b+llava,没有啥问题,可以正常训练 |
出现了上述的报错 @hhaAndroid |
@thomas-yanxin 这个错一般是数据处理时的 tokenizer 和 llm 的 embeddings 不匹配导致的 |
solved, tks~~ |
我在template.py中增加了如下内容:
但是在训练中它卡住了
The text was updated successfully, but these errors were encountered: