Нейросетевая модель для предсказания положения ударения в руских словах

Модель предназначена для определения позиции ударения в русских словах. Из-за особенностей русского языка обычно в проектах, связанных с устной речью (ASR, TTS) используется комбинация из словаря ударения и такой модели для oov-слов. Словарь для слов, ударение в которых известно априори, также находится в репозитории https://huggingface.co/inkoziev/accentuator.

В текущей версии модель умеет предсказывать только позицию основного ударения.

Файлы модели и словари

Все необходимые файлы находятся в репозитории https://huggingface.co/inkoziev/accentuator и загружаются оттуда автоматически.

Использование

import stress_model

def render(word):
    px = accentuator.predict2(word)
    print(' | '.join(accentuator.render_stress(word, pos) for pos in px))


if __name__ == '__main__':
    accentuator = stress_model.AccentuatorWrapperWithDictionary()
    render('моя')
    render('насыпать')
    render('кошка')
    render('ничегошеньки')

Метод predict2 выдает список порядковых номеров гласных, на которые падает основное ударение. В случае слов, допускающих более одного варианта ударения, выводится список длиной 2, или в некоторых редких случаях 3 значения.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
stress_model		stress_model
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

stress_model

stress_model

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

setup.py

setup.py

Repository files navigation

Нейросетевая модель для предсказания положения ударения в руских словах

Файлы модели и словари

Использование

About

Releases

Packages

Languages

License

Koziev/StressModel

Folders and files

Latest commit

History

Repository files navigation

Нейросетевая модель для предсказания положения ударения в руских словах

Файлы модели и словари

Использование

About

Topics

Resources

License

Stars

Watchers

Forks

Languages