检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务能否实时处理视频流中的文字 OCR不支持读取视频流数据,您可将视频流进行提取帧图片操作,提取出图片后进行识别。 父主题: 产品咨询类
公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
流”创建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 框选识别区 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合适大小。 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。 框选识别区应尽量扩大识别
图1 多模板框选识别区 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 单击左上方操作图标,调整当前模板图片到合适大小。 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。 框选识别区应尽量扩大
在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。 用户首次使用需要先开通服务。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。
OCR服务支持批量识别吗 OCR服务识别结果可以转化为Word、TXT、pdf吗 如何获取图片base64编码 OCR的并发是多少 调用OCR服务的区域可以与OBS资源的区域不一致吗 识别身份证正反面总计调用几次接口 如何提高识别精度 如何提高识别速度 pdf转图片方法 是否支持从非华为云存储中读取图片
公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
png OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
评估 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成框选识别区步骤,详情请见框选识别区。 进入评估页面
评估 模板总览过后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并已框选识别,详情请见模板总览。
在使用之前,需要您完成服务申请和认证鉴权,具体操作流程请参见开通服务和认证鉴权章节。 用户首次使用需要先申请开通。服务只需要开通一次即可,后面使用时无需再次申请。如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。
公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
公网http/https url OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。
支持从多个不同板式图像中提取结构化信息。 工作流流程 在“文字识别>自定义OCR”控制台选择“多模板分类工作流”创建应用,详细操作请见创建应用。您可以创建多模板服务,通过多模板训练模板分类模型和文字识别模型,实现多模板图像的文字信息结构化提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
≥0次每分钟 文字识别 每个子服务都有调用成功次数和失败次数两个指标。 对象存储服务 对象存储服务(Object Storage Service,简称OBS)是稳定、安全、高效、易用的云存储服务。文字识别接口都涉及到对用户的数据处理,用户的大量数据采用OBS批量方式处理,可以提升云上处理的总体效率。
的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为“已开通”。 如果您需要调用对象存储服务(OBS)中的数据,请在开通服务页面进行服务授权。 图2 OBS服务授权 OCR服务开通后,可在控制台进行关闭。开通服务时,计费规则默认为“按需计费”。只有调用成功才
参数名称 类型 是否可选 参数解释 默认值 image_bucket_name string 必填 桶名称,用于上传发票图片或PDF文件。 OBS桶名称,全局唯一,用于上传发票图片或PDF文件。取值范围:支持小写字母、数字、中划线(-)、英文句号(.)。 无默认值,桶名可以自定义。例
用方式: 通过OCR体验馆在线调用OCR服务API。 如果您没有开发基础,想快速体验OCR服务,OCR体验馆提供了在线网页调用方式,该方式无需编码,直接在网页上传图片,即可返回识别结果。 通过华为云API Explorer在线调用OCR服务API。 如果您是开发初学者,有代码编写
API是否可以混用 不建议混用,例如有专门的身份证识别,就不建议使用“通用文字识别”识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。 父主题: API使用类