The ASR based on the SPN

项目简介

本项目为复微杯数字一赛题的SPN解决方案——即使用SPN网络构建一个孤立词语音识别模型。该项目文件给出了波形数据前处理的代码和模型训练的代码。

项目目录

----ASR\
    |----PreProcess\           数据预处理
    |    |----preprocess.py    前处理
    |----Train\                模型训练
    |    |----datasplit.py     训练集、测试集划分
    |    |----dtwsplit.py      DTW对齐分割
    |    |----train_spn.ipynb  模型训练和评估
    |----requirements.txt       需要的pypi包
    |----readme.md             使用说明

使用说明

环境要求：Python3.8, 需要安装requirement.txt中的pypi包，可以直接通过命令pip install -r requirements.txt进行安装
数据准备：请准备Google Speech Command的数据集合，并按照label分文件夹放置；
数据前处理：打开文件preprocess.py修改输入波形数据文件路径并配置好输出路径；
模型训练: 在进行模型训练时，配置./Train/目录下各个文件中的路径，然后依次执行dtwsplit.py、datasplit.py和train_spn.ipynb文件。其中train_spn.ipynb请使用jupyter lab/notebook打开，从上到下顺序执行即可。
保存模型: 在train_spn.ipynb中存在导出SPN模型的功能，只需要配置好路径即可。

其他说明

由于完整的训练数据较大，只在该仓库中放置了小型的数据集合，如有需要请自行下载Google Speech Command 或从百度云盘下载(链接: https://pan.baidu.com/s/1fXTGaAYHVPDtipNF287x-w 提取码: qwi2)。

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Dataset		Dataset
PreProcess		PreProcess
Train		Train
readme.md		readme.md
readme_en.md		readme_en.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Dataset

Dataset

PreProcess

PreProcess

Train

Train

readme.md

readme.md

readme_en.md

readme_en.md

requirements.txt

requirements.txt

Repository files navigation

The ASR based on the SPN

项目简介

项目目录

使用说明

其他说明

About

Releases

Packages

Languages

ColsonZhang/ASR-SPN

Folders and files

Latest commit

History

Repository files navigation

The ASR based on the SPN

项目简介

项目目录

使用说明

其他说明

About

Topics

Resources

Stars

Watchers

Forks

Languages