调用图片异步检测接口并获取通用图文结果内容安全

本文介绍了调用图片异步检测接口识别通用图文OCR的方法。通用图文OCR能够识别并返回图片中的文字内容。

业务接口:/green/image/asyncscan,表示图片异步检测。

计费信息:

检测超时:

同步检测允许的最长检测时间是6秒,如果检测在该时间限制内没有完成,系统会强制返回超时错误码。如果您对实时性要求不高,可以选择异步检测,其他情况下请选择同步检测,同步检测接口的调用相对简单些。对于同步检测接口的调用,建议您将超时时间设置为6秒。

返回结果:

异步检测任务不会实时返回检测结果,您需要通过callback或者轮询的方式获取检测结果。检测结果最长保留一小时。

图片要求:

图片链接支持以下协议:HTTP和HTTPS。

图片支持以下格式:PNG、JPG、JPEG、BMP、GIF、WEBP。

图片大小限制为20 MB以内(适用于同步和异步调用),高度或者宽度不能超过30,000像素(px),且图像总像素不超过2.5亿(px)。

其中,GIF格式的图片,图像总像素不超过4,194,304(px),高度或者宽度不能超过30,000像素(px)。

图片下载时间限制为3秒内,如果下载时间超过3秒,返回下载超时。

图片像素建议不低于256*256(px),像素过低可能会影响识别效果。

图片检测接口的响应时间依赖图片的下载时间。请保证被检测图片所在的存储服务稳定可靠,建议您使用阿里云OSS存储或者CDN缓存等。

本接口的单用户QPS限制为10次/秒。超过限制,API调用会被限流,这可能会影响您的业务,请合理调用。

名称

类型

是否必须

示例值

描述

bizType

String

default

scenes

StringArray

["ocr"]

指定检测场景,取值:ocr。

callback

String

检测结果回调通知您的URL,支持使用HTTP和HTTPS协议的地址。该字段为空时,您必须定时轮询检测结果。

callback接口必须支持POST方法、UTF-8编码的传输数据,以及表单参数checksum和content。内容安全按照以下规则和格式设置checksum和content,调用您的callback接口返回检测结果。

用户UID必须是阿里云账号的UID,而不是RAM用户的UID。

content:JSON字符串格式,请自行解析反转成JSON对象。关于content结果的示例,请参见查询检测结果的返回示例。

您的服务端callback接口收到内容安全推送的结果后,如果返回的HTTP状态码为200,则表示接收成功,其他的HTTP状态码均视为接收失败。接收失败时,内容安全将最多重复推送16次检测结果,直到接收成功。重复推送16次后仍未接收成功,则不再推送,建议您检查callback接口的状态。

seed

String

aabbcc123

随机字符串,该值用于回调通知请求中的签名。

由英文字母、数字、下划线(_)组成,不超过64个字符。由您自定义,用于在接收到内容安全的回调通知时校验请求由阿里云内容安全服务发起。

当使用callback时,该字段必须提供。

例如,abc经国密SM3加密后返回66c7f0f462eeedd9d1f2d46bdc10e4e24167c4875cf2f7a2297da02b8f4ba8e0。

tasks

JSONArray

extras

JSONObject

xxx

如果使用高精度OCR识别,需要传入该参数,格式为{"type":"${ocrType}"}。ocrType取值:advanced,表示高精度OCR。

名称

类型

是否必须

示例值

描述

dataId

String

test_data_xxxx

数据ID。需要保证在一次请求中所有的ID不重复。

url

String

检测对象的URL。

公网HTTP/HTTPS URL,且长度不超过2048个字符。

文件路径格式:oss://<bucket-name>.<endpoint>/<object-name>

interval

Integer

截帧频率,GIF图、长图检测专用。

GIF图可理解为图片数组,interval参数指定了每隔多少张图片抽取一帧进行检测。只有该值存在时,才会对GIF进行截帧。

长图分为长竖图和长横图。

对长竖图(高大于400像素(px),高宽比大于2.5),按照(高:宽)取整来计算总图数,并进行切割。

对长横图(宽大于400像素(px),宽高比大于2.5),按照(宽:高)取整来计算总图数,并进行切割。

默认只会检测GIF图、长图的第一帧,interval参数用于指示后台在检测时可按照该间隔跳着检测,以节省检测成本。

interval需要与maxFrames参数组合使用。例如,设置interval为2,maxFrames为100,在检测GIF图、长图时,将每间隔1帧检测一次,最多检测100帧,计费则按照实际检测的数量计算。

maxFrames

Integer

100

最大截帧数量,GIF图、长图检测专用,默认值为1。

当interval*maxFrames小于GIF图、长图所包含的图片帧数量时,截帧间隔自动修改为GIF图、长图所包含的图片帧数/maxFrames,以提高整体检测效果。

名称

类型

示例值

描述

code

Integer

200

错误码,和HTTP状态码一致。

msg

String

OK

请求信息的响应消息。

dataId

String

test_data_xxxx

检测对象对应的数据ID。

如果在检测请求参数中传入了dataId,则此处返回对应的dataId。

taskId

String

aaa25f95-4892-4d6b-aca9-7939bc6e9baa-148619876****

检测任务的ID。

url

String

检测对象的URL。

公网HTTP/HTTPS URL,且长度不超过2048个字符。

文件路径格式:oss://<bucket-name>.<endpoint>/<object-name>

extras

JSONObject

xxx

额外调用参数,对应检测请求参数中的extras。

该参数可能会被调整,目前请勿依赖该参数的返回值。

请求示例

正常返回示例

业务接口:/green/image/results,表示查询图片异步检测结果。

计费信息:

该接口不计费。

查询超时:

建议您将查询间隔设置为30秒(即在提交异步检测任务30秒后查询结果),最长不能超出4个小时,否则结果将会丢失。

本接口的单用户QPS限制为10次/秒。超过限制,API调用会被限流,这可能会影响您的业务,请合理调用。

名称

类型

是否必须

示例值

描述

body

JSONArray

["aaa25f95-4892-4d6b-aca9-7939bc6e9baa-1486198766695"]

要查询的检测任务的taskId列表。数组中的元素个数不超过100个。

您在提交检测任务后,可以从返回数据中获取检测任务的taskId。

名称

类型

示例值

描述

code

Integer

200

错误码,和HTTP状态码一致。

msg

String

OK

请求信息的响应消息。

dataId

String

test_data_xxxx

检测对象对应的数据ID。

如果在检测请求参数中传入了dataId,则此处返回对应的dataId。

taskId

String

aaa25f95-4892-4d6b-aca9-7939bc6e9baa-148619876****

检测任务的ID。

url

String

检测对象的URL。

公网HTTP/HTTPS URL,且长度不超过2048个字符。

文件路径格式:oss://<bucket-name>.<endpoint>/<object-name>

extras

JSONObject

xxx

额外调用参数,对应检测请求参数中的extras。

该参数可能会被调整,目前请勿依赖该参数的返回值。

results

Array

名称

类型

示例值

描述

scene

String

ocr

检测场景,取值:ocr。

label

String

ocr

检测结果的分类。取值:

normal:图片中未识别出文字信息。

ocr:图片中包含文字信息。

suggestion

String

review

建议用户执行的操作,取值:

pass:无需关注返回结果。

review:关注识别出的文字信息。

rate

Float

99.91

在OCR图文识别场景中,可以不用关注该返回值。

ocrLocations

Array

ocrData

Array

本文提供了调用图片异步检测任务的具体内容,

静态图(非GIF图片)有文字时,返回识别出来的所有文字信息组合。通常文本组合信息存储于数组第一个元素上。

frames

Array

xxx

动态图(GIF图片)有文字时,返回识别出来的每一帧及对应的文字。

ocrDetailInfo

Object

只有在异步检测任务的请求参数extras中传入了{"type":"advanced"}才会返回该结果。

名称

类型

示例值

描述

wordNum

Integer

字块数量。

wordsInfo

Object

名称

类型

示例值

描述

charInfo

Array

direction

Integer

文字方向。取值:

0:横行

1:竖行

pos

Array

prob

Integer

99

置信度。

word

String

林下漏光

字块包含的文字内容。

请求示例

正常返回示例

普通图文OCR

高精度图文OCR

关注阿里云公众号或下载阿里云APP,关注云资讯,随时随地运维管控云服务

THE END
0.在线蒙古语OCR光学字符识别,图片/PDF快速转文字上传后立刻识别 如何快速识别蒙古语图片或文件上的文字? 步骤1 上传图片/PDF格式文件 从计算机选择文件,或拖拽文件进本页面或使用快捷键ALT+A截图后,按下CTRL+V粘贴文件 步骤2 选择输出格式(默认直接显示) 如果你不需要直接显示文本,则建议选择输出格式,默认支持txt,pdf,docx等等多种格式。 步骤3 点击jvzquC41qex/ympw0pku1ƒm1oqthqu
1.在线图片转文字免费图片内文字识别OCR工具免费的在线图片转文字工具,可以把你的图片中的文字内容识别出来,本文字识别(OCR)工具的准确率约90%,可识别中文、英文、日语、韩语、法语、西班牙语、德语、俄语、阿拉伯语等多种语言jvzquC41yy}/ijnvwdgp0lto1v{qkjs/ygt{k8
2.求一款,能够批量图片转文字要求只识别阿拉伯数字的软件如题 只识别图片阿拉伯数字部分 ,要求可以批量操作的软件,输出结果需要和平为一个 txt文件的 求大佬jvzquC41yy}/7;uqlkk/ew4vjtkbf667746:366/30nuou
3.在线图片文字识别(OCR)标签ai图片处理 点击选择,或将图片拖拽到此处 复制下载清空 在线图片文字识别(OCR)-工具简介 在线图片文字识别工具,支持对图片中的文字进行检测和识别,支持中文简体/繁体、英语、日语、阿拉伯语、俄语、德语、法语、西班牙语和印度语等多种语言的文字识别。 在线图片文字识别(OCR)-使用说明jvzquC41yy}/nmiiq0tfv8fk1ksbin4qet
4.PaddleOCR详解和识别图片中文字2、python 识别图片文字 一、介绍 1、什么是OCR? 光学字符识别(Optical Character Recognition, OCR),ORC是指对包含文本资料的图像文件进行分析识别处理,获取文字及版面信息的技术,检测图像中的文本资料,并且识别出文本的内容。 那么有哪些应用场景呢? 其实我们日常生活中处处都有ocr的影子,比如在疫情期间身份证识别录jvzquC41dnuh0lxfp0tfv8r2a8>:6B5861gsvrhng1jfvjnnu1737<;32;9
5.在线图片文字识别软件哪个好?ocr文字识别有何优势?小编推荐福昕全能王,福昕全能王采用业界领先的OCR识别技术,自主研发的一款文字识别系统,依托深度学习技术及海量图像样本,可精准检测出不同场景图片中的文本,实现快速定位识别,支持私有化部署、移动端SDK等多种形式使用。 福昕全能王支持识别纯英文、简繁体中文、日文、韩文、法文、德文、藏文、维文、哈萨克文、阿拉伯文、jvzquC41yy}/hx}kvuugv€ftg0io1|hcppks1sncqenfpp4336?/j}rn
6.机遇屋在进行文本识别之前,Tesseract通常会先使用这些模型来检测图像中文本的方向(例如,是水平的还是倾斜的)以及所使用的脚本(例如,拉丁文、中文、阿拉伯文等)。 通过在Tesseract初始化时指定osd参数,可以启用方向和脚本检测功能。示例代码中的chi_sim+eng表示同时使用中文简体和英语进行识别,而osd则是用于方向和脚本检测。 jvzquC41yy}/lr~wyw4dqv4Ctvodnn4Ujq}Bt}neng592?
7.全部模型规格参数计费明细大模型服务平台百炼通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。使用方法 | API参考 | 在线体验 通义千问VL模型按输入和输出的总Token数进行计费。图像Token的计算规则视觉理解。 中国大陆(北京) 国际(新加坡) 模型名称 版本jvzquC41jgrq0jqk{wt/exr1|j5nqmjn/uzvfrt1oqjfn|
8.TextScanner「OCR文字识别工具」帮你识别图片上的文字!图片中的文字无法识别怎么版?Text Scanner Mac版是一款强大好用的OCR文字识别工具,基于AI领先的深度学习算法,利用光学字符识别技术,将图片上的文字内容,直接转换为可编辑文本! Text Scanner 「OCR文字识别工具」 功能 一、场景功能 1、文本识别,识别图像上的文字 2、二维码识别 3、手写识别 4、身份证识别 5、名片jvzquC41enuvf7ygpekov7hqo1jfxnqqrgx0c{ykenk04:6;76<
9.java图片文字识别SpringBoot实战电商项目mall4j识别图片 ORC Test Begin 测试123 ORC Test End 最终识别效果一般,一些复杂文字识别出现乱码,这个时候就需要我们去训练词库了 训练越多就识别的越精确 SpringBoot实战电商项目mall4j 地址 : [https://gitee.com/gz-yami/mall4j]jvzquC41ugmngwyhcwru0lto1c523B522264;<;459=
10.‎扫描王全能宝可图片转文字的手机扫描仪App在App Store 下载“Wuhan Yousigan Technology Co., Ltd”开发的“扫描王全能宝 - 可图片转文字的手机扫描仪”。查看屏幕快照、评分与评论、用户提示以及更多类似“扫描王全能宝 - 可图片转文字的手机扫描仪”的游戏。jvzquC41crvt0jurng4dqv4ep1gqr8nf34=28=;8425
11.扫描王全能宝扫描王全能宝是一款OCR文字识别软件,使用手机就可以实现文字识别、手写识别、文件扫描、证件扫描、表格识别等功能,识别后的文字可以进行在线编辑调整、翻译,并且可以导出为word、txt、PDF、图片等多种格式,是您的移动多功能扫描仪。 ---特色功能--- - 手机扫描仪:手机拍纸质文档,生成高清JPEG、PDF文件 jvzquC41kv{og|3crrrf0lto1et0cyu1vg~u/|hcppks/yih/uibpwjt1kj24@6868<32Hq?eu
12.白描文字识别电脑版下载白描电脑版下载安装v0.3.3白描文字识别电脑版 v0.3.3官方版 OCR图片转文字、翻译与文件扫描工具 白描电脑版是一款非常不错的文字扫描提取软件,该软件采用了百度的OCR API人工智能技术进行网络识别,不仅仅对中文支持扫描使用,还支持相册扩展,你可以在系统相册中直接调用识别功能,甚至还能够根据网友的回复其识别率非常不错。同时该软件功能也是十分的强大,如:拍 jvzquC41yy}/fmtqq0ipo8xqhvjpyw432961:7mvo
13.多国语言识别多国语言文字在线识别转换多国语言识别功能支持识别中文、英文、日语、韩语等多国语言,可以帮助用户快速识别单张图片中的外语文字内容并转换为可编辑的文本,用户可以快速获取来自不同语言来源的信息.jvzquC41crv/z~slkgveh7hqo1udtmzqiwuzw‚fp
14.甲骨文图片识别APP推荐甲骨文图片识别下载豌豆荚甲骨文图片识别榜单为您提供最新甲骨文图片识别大全,这里不仅有甲骨文图片识别安卓版本APP、历史版本应用下载资源,还有类似甲骨文图片识别的应用推荐,欢迎大家前来豌豆荚下载。jvzquC41yy}/yjsfqwpjc7hqo1hbppicp173:A>:21
15.ALKATIPArial字体下载识字体网文字:拉丁文, 阿拉伯文, 符号, 中文 区块:基本拉丁文, 拉丁文-1补充, 阿拉伯文, 一般标点符号, 似字母符号, 数字形式, 数学运算符号, 圈型字母数字,为保存您的识别记录,建议您: 请您前往或! 字体安装说明 字体安装到计算机系统中,任何桌面程序的字体栏菜单都可以调用并在屏幕显示。 jvzquC41yy}/nrpghqtu0lto1huov865;:988?4
16.扫描全能王“智能高清滤镜”上线!AI自动“美颜”文档图片例如,阿拉伯语的书写方向是从右到左,而且同一字母在单词的不同位置有着不同的形态。对于这种语言,传统的文字识别方法往往难以应对;其他小语种如泰语和印地语,其书写系统相对复杂,有时一个字符可能会出现在另一个字符的上方或下方,是文字识别必须解决的问题。 jvzquC41yy}/eww0ep5uglm1vgiirq442491:::1v46359=37a;38<=27:9/uqyon
17.阿拉伯)OCR光学字符识别,图片/PDF快速转文字如何快速识别阿拉伯语(沙特阿拉伯)图片或文件上的文字? 步骤1 上传图片/PDF格式文件 从计算机选择文件,或拖拽文件进本页面或使用快捷键ALT+A截图后,按下CTRL+V粘贴文件 步骤2 选择输出格式(默认直接显示) 如果你不需要直接显示文本,则建议选择输出格式,默认支持txt,pdf,docx等等多种格式。 步骤3 点击转换并且下载文件 点击转换后,一般情况下每页文档需要消耗3-30jvzquC41qex/ympw0pku1ƒm1ctgckl
18.图片文字识别软件–在线图片文字识别–迅捷PDF转换器在线免费版图片文字识别 文档转换 PDF转换 PDF转Word PDF转图片 PDF转Excel PDF转PPT PDF转TXT PDF转HTML PDF转长图 其它转PDF Word转PDF 图片转PDF Excel转PDF PPT转PDF CAD转换 CAD转PDF CAD转图片 PDF转CAD CAD版本转换 CAJ转换 CAJ转Word CAJ转PDF OFD转换jvzquC41crv/z~slkgveh7hqo1udt8
19.怎么扫描图片识别文字?有什么图片识别文字的软件推荐吗?我们经常收到图片格式的文档或纸质文档,需要我们把它变成电子版的,但是如果把图片文档或者纸质文件用手动输入变成电子版的则浪费时间,没有必要,我们可以使用扫描文档内容,识别后复制粘贴到文档即可,下面小编来介绍一下怎么扫描图片识别文字。 怎么将图片上的文字识别扫描出来? jvzquC41yy}/hx}kvuugv€ftg0io1|hcppks1sncqenfpp4383=/j}rn
20.专业的OCR文字识别,人脸识别,人脸炫彩活体检测,智能文档处理中科逸视推出的阿拉伯语OCR系统基于深度学习技术,能够高效识别从右向左书写的阿拉伯语复杂文本,精准处理连字符、变体字符及多字体混合内容,为多场景文档数字化提供高精度解决方案。jvzquC41yy}/gjxkpi|jurtp0eun1j4|jkyik8iwq{{zcw46474ivvq
21.开源项目EasyOCR一款实用的图片OCR文字识别项目easyocr模块描述: EasyOCR 支持两种方式运行一种是常用的CPU,而另外一种是需要GPU支持并且需安装CUDA环境, 我们使用其可以进行图片中语言文字识别, 例如小程序里图片识别、车辆车牌识别(即车债管理系统)。 Tips: 在其官网有demo演示,我们可以使用其进行简单图片ocr识别,地址为https://www.jaided.ai/easyocr/或者https://huggingjvzquC41dnuh0lxfp0tfv8z235684@:81cxuklqg1fkucrqu13923:=:39
22.腾讯图片在线识别腾讯云开发者社区识别的效果也是很不错的,准确率达到97%,甚至更高的,建议尝试一下。 在线和线下无非多了一个下载过程,其他算起来还是使用专业的软件比较方便!图片文字识别是怎么在线识别出来的?哪个软件好用?拍照文字识别软件在线 1、先把需要翻译的资料或者图片准备好,然后在jvzquC41enuvf7ygpekov7hqo1jfxnqqrgx0kwkqtogukxs1'G>&:>*DG'K9'JJ'CH+F7.>D'DK&G@*:;'>8'N:';E+B:.J9'DG&DO*G:'GG'A;'G7+9:.FD