Skip to content

Releases: Yu-Yang-Li/StarWhisper

Release v0.2.0

12 Oct 08:36
4a876df
Compare
Choose a tag to compare

1.通过数据集清洗再训练,缓解了先前版本经过Agent/工具学习训练后对原有知识的灾难性遗忘,并显著提升了数学推理、代码能力,可通过code interpreter解决一系列问题。

2.公布了现版本在CG-Eval评测上的结果,总排名达到第二,仅次于GPT-4,数学推理和天文能力接近或超过GPT 3.5 Turbo。

Release v0.1.3

18 Sep 01:28
91304df
Compare
Choose a tag to compare

1.通过Tool learning语料训练,提升了模型通过Agent进行工具规划调度与执行回复的能力。
2.公布了上一版本在CG-Eval评测上的结果,天文物理能力提升明显,数学推理计算得分高于文心一言。
注:需与sft和dpo权重合并使用

Release v0.1.2

17 Aug 08:57
074419b
Compare
Choose a tag to compare

通过修改训练方法、添加长文本回答语料、进行人工反馈强化学习等方法进行了优化:
1.很大程度解决了先前版本的灾难性遗忘问题
2.提高了模型基于知识库回复的质量与逻辑性。

Release v0.1.1

09 Aug 15:20
a428f0b
Compare
Choose a tag to compare

1.采用了新的训练方式,很大程度缓解了原微调模型的灾难性遗忘问题。
2.预计最近会在HF上发布模型与权重,以方便部署。
3.经过进一步SFT与RLHF的V2版本即将发布。

Release v0.1.0

27 Jul 08:27
e21f99a
Compare
Choose a tag to compare
Update README.md