Skip to content

Latest commit

 

History

History
27 lines (20 loc) · 1.45 KB

beam_search.md

File metadata and controls

27 lines (20 loc) · 1.45 KB

集束搜索解码

本项目目前支持两种解码方法,分别是集束搜索(ctc_beam_search)和贪婪策略(ctc_greedy),项目全部默认都是使用贪婪策略解码的,集束搜索解码只支持Linux且Python为3.7、3.8、3.9的,如果要使用集束搜索方法,首先要安装swig_decoders库,执行以下命令即可安装完成。

python -m pip install paddlespeech-ctcdecoders==0.1.1 -i https://mirrors.aliyun.com/pypi/simple/

语言模型

集束搜索解码需要使用到语言模型,下载语言模型并放在lm目录下,下面下载的小语言模型,如何有足够大性能的机器,可以下载70G的超大语言模型,点击下载Mandarin LM Large ,这个模型会大超多。

cd PaddlePaddle-DeepSpeech/
mkdir lm
cd lm
wget https://deepspeech.bj.bcebos.com/zh_lm/zh_giga.no_cna_cmn.prune01244.klm

寻找最优的alpha和beta

这一步可以跳过,使用默认的alpha和beta也是不错的,如果想精益求精,可以执行下面的命令,可能速度会比较慢。执行完成之后会得到效果最好的alpha和beta参数值。

python tools/tune.py --model_path=./models/param/50.pdparams

使用集束搜索解码

在需要使用到解码器的程序,如评估,预测,指定参数--decoding_methodctc_beam_search即可,如果alpha和beta参数值有改动,修改对应的值即可。