Skip to content

Latest commit

 

History

History
29 lines (19 loc) · 1.35 KB

CCKS_2018_面向中文电子病历的命名实体识别.md

File metadata and controls

29 lines (19 loc) · 1.35 KB

比赛地址

点击这里

标注类型

  • 症状
  • 解剖部位
  • 症状描述
  • 独立症状
  • 药物
  • 手术

分析:共三大类,五小类。这道题目的特色在于:如何处理类别层次,用于更好的建模。

类型 数量
train 600个现病史文档
test 200-400个现病史文档

数据说明

电子病历主要有两类,即门诊病历和住院病历。门诊病历通常较短,包含信息较少,也缺乏对患者治疗情况的跟踪,因此本任务仅考虑住院病历。住院病历内容包括住院病案首页,入院记录,病程记录,医嘱单,辅助检查报告单,病理资料等。入院记录记录了患者入院后经诊治医师通过问诊,查体,辅助检查等获得的相关资料,具体内容包括一般项目,主诉,现病史,既往史,个人史,家族史,月经婚育史,体格检查,辅助检查,诊断等,其中,现病史的英文住院病历的重点内容,着重于了解患者本次疾病的发生,演变,诊疗经过,蕴含了更丰富的医疗信息,因此,次本评测主要面向现病史部分进行医疗命名实体的识别和抽取。如下:

img

评测指标

strict metrics + relaxed metrics