不得不说,2020年绝对是OCR开源界的丰收年,各种开源repo横空出世,一次又一次的刷新开源界的baseline,小编今天再次给大家种个草,介绍今年OCR开源领域 “真.良心之作”百度飞桨PaddleOCR。先看下飞桨文字识别套件PaddleOCR自今年年中开源以来,短短几个月在GitHub上的表现:
果然,看9月最新更新,PaddleOCR再次诚意满满为大家带来真干货,直接看官方介绍:
数量上,这次PaddleOCR一口气发布了三个系列模型,满足移动端、服务器端各种场景需求。而且,多语言也妥妥安排上了,全部训练代码和模型毫无保留开源。其中3.5M超轻量文字识别模型,堪称目前业界开源的最轻量OCR模型了。质量上,如此轻量的模型,效果有保障吗?不看广告,直接看疗效。先看几个常见的通用场景识别效果:
3.5M的模型能达到这个识别精度,绝对是良心之作了!再看一个非正常显示的图片:
文字倒着也能识别,没毛病(此处可以竖起大拇哥)。想看更多效果?官方GitHub项目链接走起。
激动的心,颤抖的手,相信有OCR玩家要问:有Demo可以动手玩一玩吗?
为了让用户快速上手,PaddleOCR也是做足了准备。
PaddleOCR在百度大脑EasyEdge上开放了文字识别APP demo。
安卓手机可直接扫码下载:
效果如下:
# pip安装
pip install paddleocr# 快速使用
对于OCR方向的开发者而言,开源repo最吸引人的莫过于
①高质量的预训练模型
②简单易上手的训练代码
③好用无坑的部署能力
简单对比一下目前主流OCR方向开源repo的核心能力:
从性能指标来看:
从功能完备来看:
开发者可以根据自己的实际需求,选择适合自己的开源方案。
对于PaddleOCR 3.5MB的超轻量模型,是如何做到的,repo中也给出了解释。
3.5M超轻量模型应用了一套超轻量OCR系统PP-OCR,主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面,采用19个有效策略,对各个模块的模型进行效果调优和瘦身,最终得到整体大小为3.5M的超轻量中英文OCR模型和2M的英文数字OCR模型。更多细节请参考文末PP-OCR技术文章。其中,飞桨模型压缩库PaddleSlim为PaddleOCR超轻量化模型的实现提供了核心的技术支撑。PaddleSlim集成了模型剪枝、量化(包括量化训练和离线量化)、蒸馏和神经网络搜索等多种业界常用且领先的模型压缩功能。通过PaddleSlim对PP-OCR中检测、检测框矫正和识别模型的压缩,从超轻量模型8.1M的压缩到3.5M,模型大小降低了56.79%,其中检测模型速度提升21%,而且整体模型精度还有一定提升。
除了3.5M超轻量OCR模型,PaddleOCR还隐藏哪些惊喜,一睹为快:1、本次开源的超轻量英文数字识别模型,不得不说,考虑的真周到,英文场景用起来更溜。
2、多语言支持,中、英、德、法、韩、日,据了解还在持续迭代更新并扩充中,欢迎体验。
PaddleOCR也提供了多语言的识别模型配置文件如下图所示:
用户可以根据自己需求重新训练,也可以在预训练基础上调优。3、文档教程,绝对是开源界的一股清流,对于OCR方向,能想到的内容,PaddleOCR应该都覆盖了吧。
其中的FAQ部分强烈推荐,面试OCR算法工程师岗位你应该用的到。
开发者如果想要使用自定义数据训练超轻量模型,也可以从PaddleOCR提供的基础算法库中选择适合自己的文本检测、识别算法,进行自定义的训练。自定义训练的存在让开发者可以使用自己的数据集打造更为契合自身需求的产品,极大程度满足了不同开发者的需求。
除了贴心的自定义训练,满足开发者产业级训练的需求之外,百度PaddleOCR为了更好的方便开发者和企业应用,打造了一系列的模型部署组件,可以支持开发者和企业在服务端、移动端、嵌入式硬件,云端服务化等多个不同的硬件平台部署,最大化地满足OCR文字识别领域的企业应用。
官网地址:
飞桨PaddleOCR项目地址:
飞桨PaddleSlim项目地址:
You set the variable "IPC_CORE_ROOT" here and it was unused before it went out of scope.[OHOS INFO] root_out_dir=//out/hispark_pegasus/hispark_pegasus_mini_system[OHOS INFO] root_build_dir=//out
起因:项目中适配了中英文语言,在切换英文语言重启软件后,部分已适配多语言的文字显示中文,在同一个Activity中有的正常,有的却不正常。探究:一开始以为哪里设置文字的时候没有去适配,于是开始整个项目搜素还是没找到,心中一万个草**跑过,于是乎来到度娘搜索,果然有人遇到类似的问题,然后开始慢慢探究...起初是在Application中 写了一个Toast 弹出一段从资源文件定义的文字,当软件语言设
100个网络安全词汇中英文对照解释搞网络安全会经常遇到一些网络安全的英文专业术语,本人将这些整理成HTML格式,以便浏览。现分享html源码如下:<!DOCTYPE html><html lang="zh"><head> <meta charset="UTF-8"> <meta n
8.6M超轻量模型发布,GitHub Trending 全球日榜榜单第一。
导读如果你是OCR方向的工程师,你一定需要知道这个OCR开源项目:PaddleOCR先看下PaddleOCR自今年开源以来,短短几个月在GitHub上的表现:7月,8.6M超轻量模型发布...
这款上了Github Trending榜单的OCR开源Repo,又放大招了
环境Python 3.6.6MacOS 10.14.6pip 19.0.1mac版的tesseract 4.1.0pip的tesseract 0.3.0安装1
谷歌免费OCR
# Python 中英文分词模型实现指南在进行文本处理时,分词是一个非常重要的步骤。尤其是在处理中文与英文混合的文本时,使用合适的分词模型能极大地提高后续自然语言处理(NLP)任务的效果。本文将向你介绍如何在Python中实现一个中英文分词模型,以下是整个流程的概述。## 项目流程| 步骤 | 描述 | 预计完成时间 ||------|------
中英文识别,精准很重要啊,百度开源媲美收费软件!
# Python 中英文双语编程教程Python 是一种广泛使用的编程语言,因其简单易懂的语法和丰富的库而受到许多开发者的喜爱。在这篇文章中,我们将介绍 Python 的基本知识,并结合中文和英文的示例和解释,帮助你更好地理解这门语言。## 1. Python 的基础语法Python 的语法相对简洁,注重代码的可读性。在 Python 中,你可以用几行代码完成许多复杂的操作。这是它的一
英文Roberta模型是2019年Facebook在论文RoBERTa: A Robustly Optimized BERT Pretraining Approach中新提出的预训练模型,其目的是改进BERT模型存在的一些问题,当时也刷新了一众NLP任务的榜单,达到SOTA效果,其模型和代码已开源,放在Github中的fairseq项目中。众所周知,英文Roberta模型使用Torch框架训练
中英文混合朗读一直是个难点,即在一段文本中要将中文和英文分离出来进行分别朗读,又不能打乱朗读的次序,所以我们设计如下的两种方法,每种方法都有各自的优点和缺点。 ①采用同步朗读方式进行混合朗读: 将朗读文本进行提取分析,提取本文本中的中文和英文,在编程中,我们设定两个标志:const int IsEnglish = 0; // 英文标志const int IsChinese = 3;
PEP8 - Python 代码风格指南中英对照IntroductionA Foolish Consistency is the Hobgoblin of Little MindsCode lay-outindentationTabs or SpacesMaximum Line LengthShould a line break before or after a binary operator
一、Oracle分析函数简介: 在日常的生产环境中,我们接触得比较多的是OLTP系统(即 Online Transaction Process),这些系统的特点是具备实时要求,或者至少说对响应的时间多长有一定的要求;其次这些系统的业务逻辑一般比较复杂,可能需要经过多次的运 算。比如我们经常接触到的电子商城。 在这些系统之外,还有一种称之为OLAP的系统(即Online Aanalyse
《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学术路上期待与您前行,加油。前一篇从个人角度介绍英文论文引言如何撰写。这篇文章将从个人角度介绍英文论文模型设计(Model Design)如何撰写,并以入侵检测系统为例(Intrusion Detection Sy
文章不够精炼。我想把我的思想过程写出来,一遍以后自己读的时候知道我当时的想法。写的时候也尽量精简了一些不必要的话。 如果有什么问题的话,希望看到的各位不吝赐教。公司用cocos2dx做游戏,使用语言是lua。 最近做角色创建。要求最多英文14个,中文7个,超过的就不能输入。(不知道什么时候起我记忆中英文是一个字节的,而中文是两个字节的。这也是比较普遍的想法吧。) 开始尝试了一下cocos2d
在电子测量中,探头作为示波器与被测电路的连接桥梁,其安全性直接关乎人身与设备的双重防护。无源探头与有源探头因结构原理的根本不同,在绝缘能力、电路保护、操作风险等维度呈现显著差异,需基于测量场景精准把握。 一、绝缘防护与耐压能力:安全设计的核心分野 绝缘性能是探头安全的第一道防线,两类探头的耐压能力差 ...
一、实验目的 了解数字存储示波器(DSO)的结构及工作原理。 掌握示波器的基本操作与主要功能。 学会利用刻度法与光标法测量电压、周期和频率。 观察拍频现象,理解两简谐波叠加形成拍的机理。 初步了解FFT频谱分析及其应用。 二、实验仪器 数字存储示波器、函数/任意波形发生器、连接导线及探头(×1/×1 ...
从入门到精通【Redis】Redis 典型应⽤ --- 分布式锁
背包问题背包问题概述背包问题(Knapsack problem)是一种组合优化的NP 完全问题。其核心是:给定一组物品,每种物品都有自己的重量和价格,在限定的总重量内,如何选择物品,才能使得物品的总价格最高。按物品个数分类根据物品的可选取个数,背包问题分为以下几类:01 背包问题:每个物品只有一个, ...
如果你的网站使用的是Discuz论坛模板,用户忘记了密码并且验证邮箱出了问题,那还有没有其它办法重置用户的密码呢?答案是有的,管理员可在管理中心重置用户的密码。下面我们就来看看管理员该如何重置Discuz论坛用户的密码吧如果你的网站使用的是Discuz论坛模板,用户忘记了密码并且验证邮箱出了问题,那还有没有其它办法重置用户的密码呢?答案是有的,管理