检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已在自定义OCR控制
Token消息体中user name,domain name和project name分别指的是什么 user name指用户名称,domain name指用户所属的账号名称。如果使用账号获取token,账号的user name和domain name相同。如果使用IAM用户获取t
创建应用 开发应用 通用单模板工作流 根据工作流指引,创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 通用单模板工作流 多模板分类工作流 根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 多模板分类工作流
据自身的业务需求使用OCR提供的入门实践。 表1 常用最佳实践 实践 描述 发票识别与验真 该实践基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查验平台进行发票真伪
wrong 请正确填写username和domainname,一般情况下,username=domainname。如不确定,可登录“我的凭证”页面查看,如果使用IAM账号获取Token: username:IAM用户名(子账号名称) domainname:账号名 返回"error_code":
图片质量类报错处理办法 问题现象 调用文字识别API时,产生以下图片质量类报错。 错误码AIS.0102:图片格式不支持。 错误码AIS.0103:图片尺寸不满足要求。 错误码AIS.0104:非支持的图片类型或图片质量差。 解决方法 请参考产品介绍 > 约束与限制章节检查图片的格式、像素是否符合规范。
如果在调用API时返回错误信息与错误码: "error_code":"ModelArts.4603","error_msg":"Obtaining the file from the URL failed. "表示从URL获取图片数据失败,可通过以下几个方面进行排查:(1)请确保提供的URL支持HTTP/
SSL配置属可选项,用户可根据具体需求确认是否需要SSL证书验证,详情如下: // 根据需要配置是否跳过SSL证书验证 // 执行SDK时出现javax.net.ssl.SSLHandshakeException: Received fatal alert: handshake_failure报错,可添加此代码,跳过SSL证书验证
id of region 'cn-north-4' not found in BasicCredentials, trying to obtain project id from IAM service: https://iam.myhuaweicloud.com 原因分析 调用服务对应终端节点下的项目ID没有生成。
支持云审计的关键操作 操作场景 平台提供了云审计服务。通过云审计服务,您可以记录与OCR相关的操作事件,便于日后的查询、审计和回溯。 前提条件 已开通云审计服务。 支持审计的关键操作列表 表1 云审计服务支持的OCR操作列表 操作名称 资源类型 事件名称 开通服务 ai_service subscribeAISubService
"error_msg":"Incorrect IAM authentication information: decrypt token fail","error_code":"APIG.0301",是因为token解密失败。 "error_msg":"Incorrect IAM authentication
的用户需求。 套餐包计费:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买套餐包规格越大,享受的折扣越大。一般适用于需求量长期稳定的成熟业务。 按需计费:一种后付费模式,即先使用再付费,按照文字识别服务实际成功调用次数结算。按需计费模式允许您根据实际业务需求灵活地
ModelArts.0212","error_msg":"Invalid Token header. The Token not contain project item. "},表示Token无效,Token中缺少project信息。 OCR服务为项目级别服务,获取Token接
务场景: 稳定业务需求:对于长期运行且资源需求相对稳定的业务,套餐包计费模式能提供较高的成本效益。 长期项目:对于周期较长的项目,套餐包计费模式可以确保在整个项目周期内资源的稳定使用。 业务高峰预测:如果能预测到业务高峰期,可提前购买套餐包资源以应对高峰期的需求,避免资源紧张。
建多模板服务,通过多模板训练模板分类模型和文字识别模型,实现多模板图像的文字信息结构化提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片
照。 医疗:化验单、报告单、药品说明书等。 物流海关:货运单、配送单等。 其他:成绩单、商超小票、支付凭证、账单等。 优势 简单智能 无需训练直接调用,自动输出结构化信息,简单高效。 多版式 不受版式数量影响,支持多版式卡证、票据,适用场景广泛。 多功能 键值对提取、表格识别与版
获取账号ID 在调用接口的时候,部分URL中需要填入账号ID(domain-id),所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下: 注册并登录管理控制台。 单击用户名,在下拉列表中单击“我的凭证”。 在“我的凭证”页面的项目列表中查看账号ID。 图1 查看账号ID
如何选择OCR套餐包的区域 不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用的服务与区域之后再购买相应区域的套餐包。 父主题: 服务开通类
体请参见终端节点。 选择需要使用的API,进行开通。 本示例中需开通身份证识别API。 由于OCR服务在发布上线时依托于ModelArts平台,因此会出现以“ModelArts”开头的错误码。详细的错误码请参见错误码。 如调用服务失败提示ModelArts.4204报错,可能是服
创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前,需要上传模板图片,明确以哪张图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。