Skip to content

zhpmatrix/cged_tf

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CGED_TF

整体思路

结合比赛本身提供的数据,可以将该问题建模为一个标注问题,例如命名实体识别等。NER的经典方案是BiLSTM+CRF。

模型架构

img

特征

输入特征为四个,分为三类:

(1) bigram特征,包括当前和前一时间步的bigram特征

(2) pos特征: 特征提取工具使用哈工大的LTP,任何其他开源工具都可以,目的是做词性标注

(3) char特征

围绕该工作,我的相关博客

中文拼写纠错-和百度比一比,这篇博客主要和百度AI平台开放的中文纠错API的结果对比,同时给出了如何接入API的方法。

中文拼写纠错,这篇博客简单的梳理了围绕该课题做的相关工作。

复现论文地址,需要说明的是实现代码的评估指标并没有完全达到论文指标,需要继续调优。

About

论文实现:《Chinese Grammatical Error Diagnosis with Long Short-Term Memory Networks》

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published