输入一直是手机的软肋,可是现在偏偏什么时候都需要用到手机,记录笔记、存放纸质文件等等手机是最好的工具,无奈受限于蹩脚的输入,用手机记录给我们徒增很多麻烦。市面上也有很多拍照扫描工具,把文字资料保存为图片,但手机这张“小脸”却天生不是查阅PDF的命。窃以为拍照自动识别文字并保存才是手机录入的正确用法,于是有人突发奇想搞出了这款“涂书笔记”——涂抹你想要的文字,识别成文字自动录入。
在“涂书笔记”之前我们也介绍够非常多的文字识别工具,拍一张照片就可以把图片中的文字识别出来,不过这里也有一个严重的Bug,天知道我拍出的照片都是我想要的内容?因此在“图涂笔记”中加入了手指涂抹的过程,这个涂抹就是人工识别的过程,把那些“抢镜头”的内容去除掉,让手机专心识别你想要的内容。
“涂书笔记”的使用场景是怎么样的?比如看一本金庸小说,其中一段描述荡气回肠,你想迫不及待的记录下来,拿笔写下来太落伍,用手机拍下来看起来不方便,这个时候打开“涂书笔记”,开启底部的摄像头横屏拍照(暂不支持竖屏),以最好垂直角度拍一张亮度足够的照片,然后用手指涂抹你想要摘抄的那一段,接下来一段电子版的金庸武侠就快速的摘抄下来了,整个过程花不了30秒。
“涂书笔记”的识别准确率怎么样?都能识别哪些文字?它能否替代手写和拍照成为我输入笔记的重要工具?下面我们就带着这些问题来测试一番。
实测涂书笔记对长文字识别精准度
“涂书笔记”对小段内容的识别能力还是值得赞赏的,一般百字的内容基本上可以完全识别。
我们也对多段长文字内容进行了测试,其中发现了一些问题。比如大段文字识别明显反应变慢;识别率也有下降但也维持在90%以上;对标点符号和特殊符号的识别能力较弱,经常丢符号;无法识别段落并排版;光线较差时出现无法开启散闪光灯的现象。
虽然有以上问题,但作为一款新生产品“涂书笔记”表现的还不错,对于中文用户来说抛掉输入和手写已经足够了。
3英语、日语、繁体和手写识别测试
英语、日语、繁体和手写识别测试
当然我们对“涂书笔记”的期待有很多,比如对英文识别,手写识别以及其他国家语言识别的效果如何呢?我们也对这些问题记性了测试。
三月份的版本中“涂书笔记”加入了英文识别功能,从测试来看效果还不错。
对于懒人来说不想抄笔记,那么“涂书笔记”其实最适合大家,我们来测试一下手写笔记能否识别。
事实证明“涂书笔记”并没有给懒人抄笔记的机会,手写笔记由于笔画过于复杂很难识别,加之各种符号和手写风格难以统一,“涂书笔记”现在还没有这么大的本事。
另外经过测试发现,像日文、韩文等还没有加入识别功能,因此对于对于日韩爱好者来说录入日韩文字还是手写或者输入吧。
原理解析 文字识别技术是如何实现的?
OCR文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程
和语音识别技术一样,人们对文字识别早在50年代就已经开始,并研制出光学字符识别器。60年代出现了采用磁性墨水和特殊字体的实用机器。60年代后期,出现了多种字体和手写体文字识别机,其识别精度和机器性能都基本上能满足要求。如用于信函分拣的手写体数字识别机和印刷体英文数字识别机。70年代主要研究文字识别的基本理论和研制高性能的文字识别机,并着重于汉字识别的研究。
像“涂书笔记”这样的工具就是利用了现在的OCR文字识别技术,这个过程一般包括图像输入、预处理等,拍照其实就是图像输入的过程,接下来对图片进行二值化处理,例如将彩色图片黑白化,分为更容易识别的前景后景信息。
对于不同的文档还需要进行噪声处理,很多时候我们排出的图片都不可避免出现倾斜这个时候也需要进行矫正处理。然后是字符切割,对于连笔的状况进行切割处理,接着就是要对单个文字进行识别,比较早有模板匹配,后来以特征提取为主,由于文字的位移,笔画的粗细,断笔,粘连,旋转等因素的影响,极大影响特征的提取的难度。
最后还会有排版、后处理以及校对等环节,看似一个拍照的过程其实中间涉及到非常多的繁琐过程,而真正识别出来的确需要很强大的技术。和语音的精准度一样,提高文字识别的精准度也是我们追求的终极目标,不过这都是实打实的技术活,“涂书笔记”也只是在现有的技术基础上提升用户体验。