Skip to content

中文羊驼大模型三期 v2.0

Compare
Choose a tag to compare
@ymcui ymcui released this 08 May 02:37
· 11 commits to main since this release
04296a0

本次发布Llama-3-Chinese-8B-Instruct-v2(指令模型),直接采用500万条指令数据在Meta-Llama-3-8B-Instruct 上进行精调。

v1版(PT+SFT,基于非Instruct版训练)和v2版(SFT,基于Instruct版训练)各有特点,可根据下游任务效果、实际主观体验等方面选择。

下载方式

模型名称 完整版 LoRA版 GGUF版
Llama-3-Chinese-8B-Instruct-v2
(指令模型)
[🤗Hugging Face]
[🤖ModelScope]
[wisemodel]
[🤗Hugging Face]
[🤖ModelScope]
[wisemodel]
[🤗Hugging Face]
[🤖ModelScope]

客观任务效果

由于Llama-3-Chinese-8B-Instruct-v2使用的初始化模型为Meta-Llama-3-8B-Instruct(其效果比非Instruct版高),相关下游任务指标相比v1均有显著提升,部分指标上超过原版。以下是部分结果:

Llama-3-Chinese-8B-Instruct Llama-3-Chinese-8B-Instruct-v2
C-Eval Valid 49.3 / 51.5 51.6 / 51.6
C-Eval Test 48.3 / 49.4 49.7 / 49.8
CMMLU Test 49.7 / 51.5 51.8 / 52.4
MMLU Valid 60.1 / 61.3 62.1 / 63.9
MMLU Test 59.8 / 61.8 62.6 / 63.7
LongBench Average 29.6 46.4

详细结果请参看:https://github.com/ymcui/Chinese-LLaMA-Alpaca-3?tab=readme-ov-file#模型效果

主观体验效果

稍后Llama-3-Chinese-8B-Instruct-v2将登陆大模型竞技场,届时将与其他模型PK效果。

注:初期票数较少,排名结果不稳定。