检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。 若上述办法均无法解决,请检查识别区的文字是否发生了偏移,或者识别图片是否跟模板属于相同版式。 父主题: 常见问题
设置用户名、密码 给子账户授予权限请参考权限管理。 图4 设置用户组 开通服务: 单击“控制台”>“服务列表”>“人工智能”>“文字识别OCR”,进入文字识别控制台。 图5 文字识别控制台 在文字识别控制台“总览”页面,选择对应产品的“终端节点”。不同区域OCR产品部署情况请参考终端节点。 图6
推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。 关于如何压缩图片,请参考以下代码。 import cv2 def resize_image(image, max_size): """ 该代码用
拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 “修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”。 “删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”。 “语种”:单击图片右侧“语种”下拉选
解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。 解决单据复杂、单据板式多、语种多问题,支持自定义多个图像板式,快速适配新板式,快速接入业务。 支持从多个不同板式图像中提取结构化信息。 工作流流程 在“文字识别>自定义OCR”控制台选择“多模板分类工作流”创建应
需要识别的图片都属于同一类型的模板。同一类模板的图片,它们有相同的版面排布,且要识别的文字类型和位置均要求固定。如果您的图片具有多种模板,请考虑使用“多模板工作流”。 确认模板类型后,要准备一张文字清晰的图作为模板图片,模板图中要包含业务需要定制识别的字段。例如上传某一格式的发票
完。 按照API调用次数收费,按次进行结算。 变更计费模式 支持变更为按需计费模式。 套餐包到期后或套餐包使用完后,如果没有及时续费或购买新的套餐包,系统将自动转为按需计费方式。 套餐包转按需 支持变更为套餐包计费模式。 按需转套餐包 适用场景 适用于可预估资源使用周期的场景,价
图片格式不支持,或image参数值不是base64编码字符串。 请检查图片格式,各服务支持图片格式请参考使用限制。 AIS.0103 The image size does not meet the requirements. 图片尺寸不满足要求。 请检查图片尺寸,各服务支持图片尺寸请参考使用限制。 AIS.0104
Python 详情请参考Python SDK SSL配置 Node.js 详情请参考Node.js SDK SSL配置 PHP 详情请参考PHP SDK SSL配置 C++ 详情请参考C++ SDK SSL配置 Go 详情请参考Go SDK SSL配置 .NET SDK 详情请参考.NET
必须确保账户余额充足。关于两种计费模式的详细介绍请参见计费模式概述。 在购买文字识别服务后,如果发现当前计费模式无法满足业务需求,您还可以变更计费模式,详细介绍请参见变更计费模式。 计费项 文字识别按API调用次数计费,计费价格请参见价格计算器。 只有调用成功才会计算调用次数,其
PI。使用方法请参见调用API实现身份证识别,视频指导请参见API使用指导视频。 通过软件开发工具包(SDK)调用OCR服务API。 如果您是开发工程师,熟悉代码编写,OCR服务为您提供Java、Python、Node.js等版本的SDK,方便您快速集成。使用方法请参见调用SDK
具体接口使用说明。不同区域所部署的接口不同,详情请参见终端节点;接口所支持的全部操作请参见2 API概览。 在调用文字识别API之前,请确保已经充分了解文字识别相关概念。 OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。 父主题: 使用前必读
需要选择对应区域,各服务部署的区域具体请参见终端节点。 选择需要使用的API,进行开通。 本示例中需开通身份证识别API。 由于OCR服务在发布上线时依托于ModelArts平台,因此会出现以“ModelArts”开头的错误码。详细的错误码请参见错误码。 如调用服务失败提示ModelArts
如果您需要使用OBS中的数据,请开通对象存储服务OBS授权。进入文字识别控制台。打开对象存储服务OBS授权的按钮,完成授权操作。完成授权即可使用授权方式的URL对服务进行访问。 图1 OBS授权 不支持跨区域OBS,OBS的区域需要和服务保持一致。 OBS特性的使用限制请参考约束与限制。 开启公共读授权(可选)
_SDK_AK和HUAWEICLOUD_SDK_SK。 认证参数说明: ak、sk:访问密钥信息,获取方法请参见准备工作。 project_id:华为云项目ID,获取方法请参见准备工作。 初始化客户端 指定云服务endpoint方式 // 指定终端节点,以 OCR 服务北京四的 endpoint
with_security_token(security_token) 认证参数说明: ak、sk:访问密钥信息,获取方法请参见准备工作。 project_id:华为云项目ID,获取方法请参见准备工作。 security_token:临时认证场景下的安全票据,可以通过token获取或者通过委托授权获取。
API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。 OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。 使用前必读 用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node
expires, expires_at: xxx","error_code":"APIG.0301",是因为Token过期。 解决方案: 请检查token是否过期。 获取token的方法,请求体信息是否填写正确,token是否正确完整。 获取token的环境与调用的环境是否一致是否跨区。
益。 成本构成 使用文字识别服务OCR时,成本主要包括两个方面: 资源成本:各类资源和资源包的成本,这取决于文字识别服务的计费项,详细介绍请参见计费项。 华为云成本中心可以帮助您更高效地管理资源成本,但运维成本需要您自行识别、管理和优化。 成本分配 成本管理的基础是树立成本责任制
IAM的终端节点。接口的认证鉴权请参见认证鉴权。 响应示例如下,例如,文字识别服务部署的区域为“cn-north-4”,响应消息体中查找“name”为“cn-north-4”,其中“projects”下的“id”即为项目ID。获取项目ID报错时,请检查{endpoint}是否填写正确。