Transformer-based-pretrained-model-for-event-extraction

使用BERT/OpenAI-GPT2/ALBERT/XLM/Roberta/XLNet/Ctrl/DistilBert/TransfoXL等预训练语言模型在ace2005数据集上进行事件抽取任务。

代码在nlpcl-lab / bert-event-extraction框架上修改，使用transformers包和CRF模型替换了原项目的模型构建部分。

模型整体采用序列标注的方式，未使用任何辅助信息。先用crf做触发词识别，再根据触发词识别结果再用crf进行论元识别。

预训练模型选用xlm-roberta-large时，trigger-f1=0.72; argument-f1=0.45。argument提升了0.05。

说明：当前是按照一个事件类型使用一个CRF进行识别论元，这会造成一定程度的数据稀疏问题，可以在consts.py中修改，将多种事件类型合并为一个CRF识别

trigger classification

P=0.677 R=0.754 F1=0.713

argument classification

P=0.588 R=0.384 F1=0.464

trigger identification

P=0.723 R=0.805 F1=0.762

argument identification

P=0.617 R=0.403 F1=0.488

超参如下

==================== 超参 ====================

可选预训练模型：

PreTrainModel = ['Bert_large', 'Gpt', 'Gpt2', 'Ctrl', 'TransfoXL',

'Xlnet_base', 'Xlnet_large', 'XLM', 'DistilBert_base', 'DistilBert_large',

'Roberta_base', 'Roberta_large', 'XLMRoberta_base', 'XLMRoberta_large',

'ALBERT-base-v1', 'ALBERT-large-v1', 'ALBERT-xlarge-v1', 'ALBERT-xxlarge-v1',

'ALBERT-base-v2', 'ALBERT-large-v2', 'ALBERT-xlarge-v2', 'ALBERT-xxlarge-v2']

       early_stop = 5
               lr = 1e-05
               l2 = 1e-05
         n_epochs = 50
           logdir = logdir
         trainset = data/train.json
           devset = data/dev.json
          testset = data/test.json
       LOSS_alpha = 1.0        
   PreTrain_Model = XLMRoberta_large
       model_path = /Transformer-based-pretrained-model-for-event-extraction-master/save_model/latest_model.pt
       batch_size = 16

运行

在LDC网站获取ACE2005数据集,企业和学校购买后方可获取(LDC2006T06)： https://catalog.ldc.upenn.edu/byyear#2005
按照 https://github.com/nlpcl-lab/ace2005-preprocessing 的方法，将ACE2005数据处理为json格式的train/dev/test后放入\data文件夹，处理后的格式应该和\data中sample.json一致
安装依赖环境
训练评估：python DataLoadAndTrain.py --LOSS_alpha=1 --lr=1e-5 --l2=1e-5 --early_stop=5 --PreTrain_Model="XLMRoberta_large" --batch_size=16

我的邮箱：491377729@qq.com

我的知乎主页：https://www.zhihu.com/people/zhang-han-32-13-81

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
data		data
migration_model		migration_model
DataLoadAndTrain.py		DataLoadAndTrain.py
README.md		README.md
consts.py		consts.py
model.py		model.py
requirements.txt		requirements.txt
utils.py		utils.py
visualiztion.py		visualiztion.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

data

data

migration_model

migration_model

DataLoadAndTrain.py

DataLoadAndTrain.py

README.md

README.md

consts.py

consts.py

model.py

model.py

requirements.txt

requirements.txt

utils.py

utils.py

visualiztion.py

visualiztion.py

Repository files navigation

Transformer-based-pretrained-model-for-event-extraction

说明：当前是按照一个事件类型使用一个CRF进行识别论元，这会造成一定程度的数据稀疏问题，可以在consts.py中修改，将多种事件类型合并为一个CRF识别

trigger classification

argument classification

trigger identification

argument identification

==================== 超参 ====================

运行

About

Releases

Packages

Languages

Hanlard/Transformer-based-pretrained-model-for-event-extraction

Folders and files

Latest commit

History

Repository files navigation

Transformer-based-pretrained-model-for-event-extraction

说明：当前是按照一个事件类型使用一个CRF进行识别论元，这会造成一定程度的数据稀疏问题，可以在consts.py中修改，将多种事件类型合并为一个CRF识别

trigger classification

argument classification

trigger identification

argument identification

==================== 超参 ====================

运行

About

Topics

Resources

Stars

Watchers

Forks

Languages