Skip to content

Latest commit

 

History

History
51 lines (38 loc) · 1.15 KB

GETTING_STARTED.md

File metadata and controls

51 lines (38 loc) · 1.15 KB

快速使用

准备数据

  1. download_data目录下载一个小的数据集。
cd download_data/
python thchs_30.py

注意: 以上代码只支持在Linux下执行,如果是Windows的话,可以获取程序中的DATA_URL的下载地址单独下载,建议用迅雷等下载工具,这样下载速度快很多。然后把download()函数改为文件的绝对路径,如下。

# 把这行代码
filepath = download(url, md5sum, target_dir)
# 修改为
filepath = "D:\\Download\\data_thchs30.tgz"
  1. 最后执行下面的数据集处理程序。
python create_data.py

训练模型

执行下面命令开始训练。

python train.py

评估

执行下面这个脚本对模型进行评估,通过字符错误率来评价模型的性能。

python eval.py --resume_model=models/conformer_streaming_fbank/best_model/

导出模型

导出为预测模型。

python export_model.py --resume_model=models/conformer_streaming_fbank/best_model/

预测

预测音频文件。

python infer_path.py --wav_path=./dataset/test.wav