Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Где найти объяснение структуры xml дампа корпуса? #899

Open
rodion-m opened this issue Oct 3, 2021 · 4 comments

Comments

@rodion-m
Copy link

rodion-m commented Oct 3, 2021

Ребята, не смог найти документацию к данным XML файла с размеченными текстами. Подскажите, пожалуйста, где искать.

В первую очередь интересуют возможные значения тега v и их расшифровка (пример: NOUN, inan, masc, loct, PNCT и тд).

@bzaar
Copy link

bzaar commented Oct 4, 2021

http://opencorpora.org/dict.php?act=gram

@victorbocharov
Copy link
Contributor

@grandsbor у нас же только XSD есть для дампа корпуса?

@grandsbor
Copy link
Member

Да, документации по экспорту как для словаря - нет.

@rodion-m
Copy link
Author

rodion-m commented Oct 4, 2021

http://opencorpora.org/dict.php?act=gram

Спасибо!

@victorbocharov Да, схему я использую. Возможно тогда имеет смысл оставить этот issue для трекинга задачи по созданию документации для дампа корпуса. Точно резонно хотя бы эту ссылку добавить на страницу закачки дампа корпуса. Вот сюда, рядом со схемой или во вкладку формат.

@rodion-m rodion-m changed the title Где найти объяснение структуры документа? Где найти объяснение структуры xml дампа корпуса? Oct 4, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants