Skip to content

Gaussiandra/RuREBus_NER_RE

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 

Repository files navigation

Решение дорожки RuREBus в рамках DIALOGUE EVALUATION 2020 - соревнованию по извлечению отношений в бизнес-постановке. В качестве датасета использовались документы минестерства экономического развития, в котором было 17 типов именованных сущностей и 12 типов связей.

Пример данных

Снимок

  • Для задачи NER использовалась архитектура CharCNN + ELMO embeddings -> BLSTM -> CRF, что в результате дало 0.492 F1.
  • Задача RE решалась архитектурой, схожей с описанной в этой статье: Две головы, состоящие из CharCNN + ELMO embeddings -> BLSTM -> CNN -> Linear. В одну подаётся предложение в исходном виде, во вторую в порядке, определяемом синтаксическим разбором -- кратчайшим путём в графе разбора между рассматриваемой парой слов. В лоссе учитывается выход каждой головы, а также выход, получаемый объединением признаков с этих голов. Описанный подход даёт 0.33 F1 на тестовых данных. Снимок

About

Решение задач NER и RE в треке RuREBus с Dialogue 2020.

Topics

Resources

Stars

Watchers

Forks