当前位置:首页 > 资讯 > 正文

截图识别对比:CnOCR与PaddleOCR

  想使用PyAutoGUI做界面自动化,需要一个ocr库识别压测软件的文字,然后获取定位。现在找到了CnOCR与PaddleOCR,都安装来试试看,哪一个更适合我的需求,这里对这俩库进行对比。 本机环境:

 

截图识别对比:CnOCR与PaddleOCR

两个库都有详细的安装步骤,有报错就去百度,安装对应的库就好了。   特别提醒安装Polygon3报错:Microsoft Visual C++ 14.0 or greater is required. Get it with “Microsoft C++ Build Tools”: Microsoft C++ Build Tools - Visual Studio。   不要去安Visual Studio,去https://www.lfd.uci.edu/~gohlke/pythonlibs/下载一个Polygon3-3.0.9.1-cp39-cp39-win_amd64.whl包,手动安就好了。

CnOCR:

  CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。 开源地址:https://gitee.com/cyahua/cnocr/ 安装使用国内源快一点

 

PaddleOCR(飞桨)

  PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程。 开源地址:https://gitee.com/paddlepaddle/PaddleOCR 安装命令:

 

待识别原图: 截图识别对比:CnOCR与PaddleOCR

CnOCR:

使用还是挺方便,有几个模型选用,我主要是识别软件截图,就使用了doc-densenet_lite_136-gru的文档图片模型,试了几个图片,比通用模型要好一点点。

 

识别出的文字:   其中score是:识别结果的得分(置信度),取值范围为 [0, 1];得分越高表示越可信   从结果对比原图,有较多的图标被识别成文字,我需要点击的【jp@gc - Transactions per Second】等标题,置信度不高。

 

PaddleOCR(飞桨)

就是默认设置,示例代码

 

识别出的文字:   速度慢点,但是内容明细精准许多。

 

有个飞桨的可视化图 截图识别对比:CnOCR与PaddleOCR