Releases · Yu-Yang-Li/StarWhisper

12 Oct 08:36

Yu-Yang-Li

Release v0.2.0 Latest

Latest

1.通过数据集清洗再训练，缓解了先前版本经过Agent/工具学习训练后对原有知识的灾难性遗忘，并显著提升了数学推理、代码能力，可通过code interpreter解决一系列问题。

2.公布了现版本在CG-Eval评测上的结果，总排名达到第二，仅次于GPT-4，数学推理和天文能力接近或超过GPT 3.5 Turbo。

Assets 4

18 Sep 01:28

Yu-Yang-Li

Release v0.1.3

1.通过Tool learning语料训练，提升了模型通过Agent进行工具规划调度与执行回复的能力。
2.公布了上一版本在CG-Eval评测上的结果，天文物理能力提升明显，数学推理计算得分高于文心一言。
注：需与sft和dpo权重合并使用

Assets 3

17 Aug 08:57

Yu-Yang-Li

Release v0.1.2

通过修改训练方法、添加长文本回答语料、进行人工反馈强化学习等方法进行了优化:
1.很大程度解决了先前版本的灾难性遗忘问题
2.提高了模型基于知识库回复的质量与逻辑性。

Assets 4

09 Aug 15:20

Yu-Yang-Li

Release v0.1.1

1.采用了新的训练方式，很大程度缓解了原微调模型的灾难性遗忘问题。
2.预计最近会在HF上发布模型与权重，以方便部署。
3.经过进一步SFT与RLHF的V2版本即将发布。

Assets 3

27 Jul 08:27

Yu-Yang-Li

Release v0.1.0

Update README.md

Assets 3

Provide feedback