模型训练评估文本识别《addlev使用教程》|波斯语教程_阿拉伯语

PaddleOCR 支持两种数据格式: lmdb 用于训练公开数据，调试算法; 通用数据训练自己的数据:

请按如下步骤设置数据集：

训练数据的默认存储路径是 PaddleOCR/train_data,如果您的磁盘上已有数据集，只需创建软链接至数据集目录：

若您希望使用自己的数据进行训练，请参考下文组织您的数据。

注意：默认请将图片路径和图片标签用 \t 分割，如用其他方式分割将造成训练报错

PaddleOCR 提供了一份用于训练 icdar2015 数据集的标签文件，通过以下方式下载：

最终训练集应有如下文件结构：

最后需要提供一个字典（{word_dict_name}.txt），使模型在训练时，可以将所有出现的字符映射为字典的索引。

因此字典需要包含所有希望被正确识别的字符，{word_dict_name}.txt需要写成如下格式，并以 utf-8 编码格式保存：

您可以按需使用。

如果希望支持识别”空格”类别, 请将yml文件中的 use_space_char 字段设置为 True。

PaddleOCR提供了训练脚本、评估脚本和预测脚本，本节将以 CRNN 识别模型为例：

首先下载pretrain model，您可以下载训练好的模型在 icdar2015 数据上进行finetune

开始训练:

如果您安装的是cpu版本，请将配置文件中的 use_gpu 字段修改为false

PaddleOCR提供了多种数据增强方式，如果您希望在训练时加入扰动，请在配置文件中设置 distort: true。

默认的扰动方式有：颜色空间转换(cvtColor)、模糊(blur)、抖动(jitter)、噪声(Gasuss noise)、随机切割(random crop)、透视(perspective)、颜色反转(reverse)。

由于OpenCV的兼容性问题，扰动操作暂时只支持Linux

如果验证集很大，测试将会比较耗时，建议减少评估次数，或训练完再进行评估。

提示：可通过 -c 参数选择 configs/rec/ 路径下的多种模型配置进行训练，PaddleOCR支持的识别算法有：

注意，预测/评估时的配置文件请务必与训练一致。

您有两种方式创建所需的配置文件：

以意大利语为例，如果您的数据是按如下格式准备的：

可以使用默认参数，生成配置文件：

手动修改配置文件

您也可以手动修改模版中的以下几个字段:

目前PaddleOCR支持的多语言算法有：

如您希望在现有模型效果的基础上调优，请参考下列说明修改配置文件：

以 rec_french_lite_train 为例：

使用 PaddleOCR 训练好的模型，可以通过以下脚本进行快速预测。

THE END

模型训练评估文本识别《addlev使用教程》