Skip to content

Latest commit

 

History

History
15 lines (8 loc) · 611 Bytes

2023_CHIP2023_药品纸质文档识别与实体关系抽取.md

File metadata and controls

15 lines (8 loc) · 611 Bytes

比赛内容

按照药监局管理规定,药品说明书必须注明药品名称、成分、适应症、用法用量,不良反应等内容。本任务的目标既要求针对药品说明书的扫描件进行OCR识别,提取规定段落,形成结构化的数据,同时也需要从指定段落的非结构化文本中,将核心实体和关系挖掘出来。

比赛地址

https://tianchi.aliyun.com/competition/entrance/532156/information

比赛思路

特定场景下的OCR识别问题,需要传统信息抽取的方法。

数据集

可联系repo维护者(暂时没有)