Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

离线ocr更新 #41

Open
6 of 11 tasks
xushengfeng opened this issue Aug 6, 2022 · 4 comments
Open
6 of 11 tasks

离线ocr更新 #41

xushengfeng opened this issue Aug 6, 2022 · 4 comments
Labels
新需求 新功能和需求

Comments

@xushengfeng
Copy link
Owner

xushengfeng commented Aug 6, 2022

目前的离线ocr使用PaddleOCR的c++部署和python部署(mac下)编译而成。
这样的方式有几个缺点

  • 首先是个人问题:无论是win下需要安装依赖,还是linux下的链接库,都让我这个只了解一些js语言的菜鸟感到汗颜。
    我个人的能力不行衍生出不可把握的问题:原先使用离线ocr的逻辑是:保存框选区域到临时文件夹,使用编译好的二进制文件识别,输出结果并返回到eSearch,此过程耦合性较小,还会有许多奇怪的错误(比如 OCR报错 #6 中的路径配置错误)。
  • 再者是跨平台问题:Paddle的部署有些麻烦,对于新平台的申请(如mac M1 add Apple Silicon support #30 ),离线ocr会较难部署。

综上,新的离线OCR需要主要使用js语言、与nodejs耦合度较高、跨平台更快捷、同时性能不会损失太大

幸好onnx让这一设想成为可能
设想使用onnxruntime,保证执行模型时的性能
会在周末时间开发,预计3周,可能其他功能的开发会推后
目前已实现:

@xushengfeng xushengfeng pinned this issue Aug 6, 2022
@xushengfeng xushengfeng added the 新需求 新功能和需求 label Aug 9, 2022
@Gloryandel
Copy link

非常强大,大佬,演示视频中的Dock栏是Windows软件吗?叫什么?😀

@xushengfeng
Copy link
Owner Author

非常强大,大佬,演示视频中的Dock栏是Windows软件吗?叫什么?grinning

是kde plasma的面板,kde主要提供linux桌面,不知windows有没有

@litterye
Copy link

litterye commented Mar 6, 2023

大佬,可以增加跨屏截图吗?
绘制截图区域的时候,canvas 绘制4个阴影区和1个透明区,在快速拖4条边或者4个角,会出现绘制卡顿问题;

@xushengfeng
Copy link
Owner Author

大佬,可以增加跨屏截图吗? 绘制截图区域的时候,canvas 绘制4个阴影区和1个透明区,在快速拖4条边或者4个角,会出现绘制卡顿问题;

跨屏截图太难了,现在没精力搞😔
卡顿是怎么样的,是整个软件卡还是拖动不跟手,屏幕分辨率是怎样的,能创建个新issue描述一下吗

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
新需求 新功能和需求
Projects
None yet
Development

No branches or pull requests

3 participants