Skip to content

Latest commit

 

History

History
68 lines (49 loc) · 7.69 KB

models_list.md

File metadata and controls

68 lines (49 loc) · 7.69 KB

PP-Structure 系列模型列表

1. 版面分析模型

模型名称 模型简介 推理模型大小 下载地址 dict path
picodet_lcnet_x1_0_fgd_layout 基于PicoDet LCNet_x1_0和FGD蒸馏在PubLayNet 数据集训练的英文版面分析模型,可以划分文字、标题、表格、图片以及列表5类区域 9.7M 推理模型 / 训练模型 PubLayNet dict
ppyolov2_r50vd_dcn_365e_publaynet 基于PP-YOLOv2在PubLayNet数据集上训练的英文版面分析模型 221.0M 推理模型 / 训练模型 同上
picodet_lcnet_x1_0_fgd_layout_cdla CDLA数据集训练的中文版面分析模型,可以划分为表格、图片、图片标题、表格、表格标题、页眉、脚本、引用、公式10类区域 9.7M 推理模型 / 训练模型 CDLA dict
picodet_lcnet_x1_0_fgd_layout_table 表格数据集训练的版面分析模型,支持中英文文档表格区域的检测 9.7M 推理模型 / 训练模型 Table dict
ppyolov2_r50vd_dcn_365e_tableBank_word 基于PP-YOLOv2在TableBank Word 数据集训练的版面分析模型,支持英文文档表格区域的检测 221.0M 推理模型 同上
ppyolov2_r50vd_dcn_365e_tableBank_latex 基于PP-YOLOv2在TableBank Latex数据集训练的版面分析模型,支持英文文档表格区域的检测 221.0M 推理模型 同上

2. OCR和表格识别模型

2.1 OCR

模型名称 模型简介 推理模型大小 下载地址
en_ppocr_mobile_v2.0_table_det PubTabNet数据集训练的英文表格场景的文字检测 4.7M 推理模型 / 训练模型
en_ppocr_mobile_v2.0_table_rec PubTabNet数据集训练的英文表格场景的文字识别 6.9M 推理模型 / 训练模型

如需要使用其他OCR模型,可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir, rec_model_dir两个字段即可。

2.2 表格识别模型

模型名称 模型简介 推理模型大小 下载地址
en_ppocr_mobile_v2.0_table_structure 基于TableRec-RARE在PubTabNet数据集上训练的英文表格识别模型 6.8M 推理模型 / 训练模型
en_ppstructure_mobile_v2.0_SLANet 基于SLANet在PubTabNet数据集上训练的英文表格识别模型 9.2M 推理模型 / 训练模型
ch_ppstructure_mobile_v2.0_SLANet 基于SLANet的中文表格识别模型 9.3M 推理模型 / 训练模型

3. KIE模型

在XFUND_zh数据集上,不同模型的精度与V100 GPU上速度信息如下所示。

模型名称 模型简介 推理模型大小 精度(hmean) 预测耗时(ms) 下载地址
ser_VI-LayoutXLM_xfund_zh 基于VI-LayoutXLM在xfund中文数据集上训练的SER模型 1.1G 93.19% 15.49 推理模型 / 训练模型
re_VI-LayoutXLM_xfund_zh 基于VI-LayoutXLM在xfund中文数据集上训练的RE模型 1.1G 83.92% 15.49 推理模型 / 训练模型
ser_LayoutXLM_xfund_zh 基于LayoutXLM在xfund中文数据集上训练的SER模型 1.4G 90.38% 19.49 推理模型 / 训练模型
re_LayoutXLM_xfund_zh 基于LayoutXLM在xfund中文数据集上训练的RE模型 1.4G 74.83% 19.49 推理模型 / 训练模型
ser_LayoutLMv2_xfund_zh 基于LayoutLMv2在xfund中文数据集上训练的SER模型 778.0M 85.44% 31.46 推理模型 / 训练模型
re_LayoutLMv2_xfund_zh 基于LayoutLMv2在xfun中文数据集上训练的RE模型 765.0M 67.77% 31.46 推理模型 coming soon / 训练模型
ser_LayoutLM_xfund_zh 基于LayoutLM在xfund中文数据集上训练的SER模型 430.0M 77.31% - 推理模型 / 训练模型
  • 注:上述预测耗时信息仅包含了inference模型的推理耗时,没有统计预处理与后处理耗时,测试环境为V100 GPU + CUDA 10.2 + CUDNN 8.1.1 + TRT 7.2.3.4

在wildreceipt数据集上,SDMGR模型精度与下载地址如下所示。

模型名称 模型简介 模型大小 精度 下载地址
SDMGR 关键信息提取模型 78.0M 86.70% 推理模型 coming soon / 训练模型