模型训练评估文本识别《addlev使用教程》

PaddleOCR 支持两种数据格式: lmdb 用于训练公开数据,调试算法; 通用数据 训练自己的数据:

请按如下步骤设置数据集:

训练数据的默认存储路径是 PaddleOCR/train_data,如果您的磁盘上已有数据集,只需创建软链接至数据集目录:

若您希望使用自己的数据进行训练,请参考下文组织您的数据。

注意: 默认请将图片路径和图片标签用 \t 分割,如用其他方式分割将造成训练报错

PaddleOCR 提供了一份用于训练 icdar2015 数据集的标签文件,通过以下方式下载:

最终训练集应有如下文件结构:

最后需要提供一个字典({word_dict_name}.txt),使模型在训练时,可以将所有出现的字符映射为字典的索引。

因此字典需要包含所有希望被正确识别的字符,{word_dict_name}.txt需要写成如下格式,并以 utf-8 编码格式保存:

您可以按需使用。

如果希望支持识别”空格”类别, 请将yml文件中的 use_space_char 字段设置为 True。

PaddleOCR提供了训练脚本、评估脚本和预测脚本,本节将以 CRNN 识别模型为例:

首先下载pretrain model,您可以下载训练好的模型在 icdar2015 数据上进行finetune

开始训练:

如果您安装的是cpu版本,请将配置文件中的 use_gpu 字段修改为false

PaddleOCR提供了多种数据增强方式,如果您希望在训练时加入扰动,请在配置文件中设置 distort: true。

默认的扰动方式有:颜色空间转换(cvtColor)、模糊(blur)、抖动(jitter)、噪声(Gasuss noise)、随机切割(random crop)、透视(perspective)、颜色反转(reverse)。

由于OpenCV的兼容性问题,扰动操作暂时只支持Linux

如果验证集很大,测试将会比较耗时,建议减少评估次数,或训练完再进行评估。

提示: 可通过 -c 参数选择 configs/rec/ 路径下的多种模型配置进行训练,PaddleOCR支持的识别算法有:

注意,预测/评估时的配置文件请务必与训练一致。

您有两种方式创建所需的配置文件:

以意大利语为例,如果您的数据是按如下格式准备的:

可以使用默认参数,生成配置文件:

手动修改配置文件

您也可以手动修改模版中的以下几个字段:

目前PaddleOCR支持的多语言算法有:

如您希望在现有模型效果的基础上调优,请参考下列说明修改配置文件:

以 rec_french_lite_train 为例:

使用 PaddleOCR 训练好的模型,可以通过以下脚本进行快速预测。

THE END
0.波斯语教程(二)(豆瓣)《波斯语教程2》是大学本科波斯语专业的基础教材。全书共三十课分一、二册,供一、二年级使用。本教材以基础阶段听、说、写、读“四会”为目标。内容包括语音、会话、课文、阅读、诗歌、语法、生词、书法和练习。全书注重科学性、知识性和趣味性,并照顾以汉语为母语的学生的学习特点。编排形式突出重点、图文并茂。 jvzquC41dqul0mtwdct/exr1kuho1B<:95623?538;
1.《波斯语教程(第一册)[伊朗]安·米尔扎伊·巴凯尔·穆[伊朗]芙当当商务印书馆官方旗舰店在线销售正版《波斯语教程(第一册) [伊朗]安·米尔扎伊·巴凯尔·穆 [伊朗]芙鲁伊·巴尔泽力哈·穆 编著 商务印书馆》。最新《波斯语教程(第一册) [伊朗]安·米尔扎伊·巴凯尔·穆 [伊朗]芙鲁伊·巴尔泽力哈·穆 编著 商务印书馆》简介、书评、试读jvzq<84rtqjve}3fcpmecwl0eqs03:<742>66?;0jvsm
2.波斯语教程《波斯语教程(第四册)(第二版)》是在靠前版的基础上重新修订的,全书的内容作了较大调整,尤其是阅读材料几乎都是新增的,适合于教与学双方的需要。 目录 ●伊朗现代文学简介●什么是文学?●《石油输出国组织》(OPEC)●史诗诗人菲尔多西●《她的眼睛》(小说节选)●《伊斯兰会议组织》●学习●音像资料●国民统计jvzquC41ujuq3==689>40v3{qw€bp7hqo1}teptqfu5eg}fkn19fo€qtu8i8m~j
3.波斯语教程(第三册)《波斯语教程(第三册)》作者:北京大学出版社,出版社:2004年6月 第1版,ISBN:18.00。本书为《波斯语教程》第三册,供大学波斯语专业三年级学生使用。是国内第一本高年级波斯语精读教材。本书共jvzquC41o0qpppk|0eun1rygo18:;><:85
4.[M]波斯语阅读教程9787519248062价格图片品牌报价本教程遵循现代外语教学理念,根据波斯语教学特点,以循序渐进为原则精心编写而成。教程在巩固精读课所学语法知识、扩大词汇量的同时,重点训练学生的波斯语阅读技巧,提高阅读速度,培养学生正确理解篇章内容和分析归纳问题的能力,以期扩大学生的知识面和文化视野,为全面提高波斯语综合应用能力打下良好基础。本书适合高等学校jvzquC41o0yvprsi0eun1ywqfwiu195938855==133;2;:=492;/j}rn
5.实用波斯语教程实用波斯语教程——世界图书出版广东有限公司出品 中国和伊朗两国关系悠久,古老的丝绸之路连接了两个文明古国。新时代两国关系得到新的发展,政治文化经济各领域的关系不断深化,民间交往越发紧密。国内对波斯语人才的需求也不断增加,于是本书便应运而生。课后附有国情jvzquC41crvt0jurng4dqv4oo1gqr8*G7'GF'BJ'G9+:6.F:'G<&D<*C4'K7'B;'CH+F:.FH'CJ&G?*;7'?:'N<'C:+9D8nf36683A<4;9Etgn2cnnCegjnqrks/xyjgt3bryx
6.波斯语教程(一)(第二版)(豆瓣)书影梦龙 10月9日 想读 长湖镇第一公民 1月18日 读过 衔泥鸟 2024年12月26日 读过 哥谭月光 2024年7月19日 想读 > 3人在读 > 11人读过 > 22人想读 二手市场 ··· 在豆瓣转让 有22人想读,手里有一本闲着? 订阅关于波斯语教程(一)(第二版)的评论: feed: rss 2.0© 2005jvzquC41dqul0mtwdct/exr1uwhkgly148=:5=8:1
7.《波斯语教程第二版(全套四册)大学专业波斯语教材北京大学出版社波斯语教程第二版(全套四册) 大学专业波斯语教材 北京大学出版社 波斯语教程 第二版 第一册 ¥ 累计评价0 降价通知 商品系列 波斯语教程 第二版 第一册 波斯语教程 第二版 第二册 波斯语教程 第二版 第三册 波斯语教程 第二版 第四册jvzquC41kvkn0si0eqs0396325?34;=7634ivvq
8.教育语种波斯语语法资料+教程PDF波斯语词典 波斯语教程 jvzquC41ddy/rrsiiw4ptp4vjtkbf66779=:7A23/34ivvq
9.古波斯语教程(豆瓣)本书作为古波斯语教程,是汉语学界用严格的历史比较语言学与语文学方法撰写的印欧语系古代语言语法。它不但对于中国历史比较语言学-语文学的建设具有示范性意义,也能现实地促进汉语学界对于古代伊朗文明的深度认知,加强中国与其他有着悠久深厚之历史底蕴的文明古国之“文明互鉴”。 作者借鉴了国际学界的最主要研究成果,从jvzquC41dqul0mtwdct/exr1uwhkgly158696<>51
10.Vant4国际化Vant4中文教程Vant 采用中文作为默认语言,同时支持多语言切换,请按照下方教程进行国际化设置。使用方法多语言切换Vant 通过 Locale 组件实现多语言支持,使用 ​Locale.use​ 方法可以切换当前使用的语言。 import { Locale } from 'vant'; // 引入英文语言包 import enUS from 'vant/es/locale/lang/en-US'; Locale.use('jvzquC41o0}4e|hjqqr/ew4rec{{1yhcw|337‚=5si>/j}rn