Finnish parliament ASR Kaldi model recipes

This repository contains Kaldi recipes for training models using the Finnish Parliament ASR corpus.

Requirements

In addition to Kaldi, the recipes rely on three external tools to do subword tokenization and language modeling.

VariKN

VariKN is used to do n-gram language modeling. For download and installation, see the VariKN Github.

SentencePiece

SentencePiece is used for subword tokenization. For download and installation, see the SentencePiece Github.

Subword-kaldi

Subword-kaldi is included as a git submodule in this repository. To get the submodule, run

git submodule init
git submodule update

SpeechBrain models

See this separate repository for the SpeechBrain models.

Name		Name	Last commit message	Last commit date
Latest commit History 131 Commits
conf		conf
local		local
notes		notes
subword-kaldi @ b4a45d9		subword-kaldi @ b4a45d9
.gitignore		.gitignore
.gitmodules		.gitmodules
README.md		README.md
cmd.sh		cmd.sh
path.sh		path.sh
run.sh		run.sh
steps		steps
utils		utils

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

conf

conf

local

local

notes

notes

subword-kaldi @ b4a45d9

subword-kaldi @ b4a45d9

.gitignore

.gitignore

.gitmodules

.gitmodules

README.md

README.md

cmd.sh

cmd.sh

path.sh

path.sh

run.sh

run.sh

steps

steps

utils

utils

Repository files navigation

Finnish parliament ASR Kaldi model recipes

Requirements

VariKN

SentencePiece

Subword-kaldi

SpeechBrain models

About

Releases

Packages

Contributors 2

Languages

aalto-speech/fin-parl-models

Folders and files

Latest commit

History

Repository files navigation

Finnish parliament ASR Kaldi model recipes

Requirements

VariKN

SentencePiece

Subword-kaldi

SpeechBrain models

About

Resources

Stars

Watchers

Forks

Languages