检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
南 OCR系列介绍 文字识别服务在计算机视觉的重要性、基本技术和最新进展 智能客服 您好!我是有问必答知识渊博的的智能问答机器人,有问题欢迎随时求助哦! 社区求助 华为云社区是华为云用户的聚集地。这里有来自容器服务的技术牛人,为您解决技术难题。
识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过AI分类算法,自动识别图片所需使用
cket 选择已创建的委托。 图4 资源栈设置 在配置确认页面中,单击“创建执行计划”。 图5 配置确认 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确认”。 图6 创建执行计划 等待执行计划状态为“创建成功,待部署”后,单击“部署”,并且在弹出的执行计划确认框中单击“执行”。
创建企业项目后,在传参时,有以下三类场景。 携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
IAM用户缺少某个特定权限现象 当创建的IAM用户缺少某个特定权限时,执行开通操作时,会报错误原因和缺少的权限。例如,下图报ocr:webImage:subscribe permission required错误(开通网络图片识别的权限)。 图2 IAM用户缺少网络图片识别权限 出现此类报错,
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。 表1 OCR的数据保护手段和特性
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 文字识别的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 业务的服务器部署区域与OCR服务区域不一致,只要服务器可以访问公网,即可使用OCR服
Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。 前提条件 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。
ModelArts.0212报错处理方法 ModelArts.4603、ModelArts.4704报错处理方法 ModelArts.4204报错处理方法 图片质量类报错处理办法
API 智能文档解析 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 印章识别 身份证识别 户口本识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 不动产证识别 车辆合格证识别 道路运输从业资格证识别 车牌识别 名片识别 VIN码识别
使用SDK前需要安装华为云Go SDK 库。 // 安装华为云 Go SDK 库 go get github.com/huaweicloud/huaweicloud-sdk-go-v3 开始使用 在开始使用之前,请确保您安装的是最新版本的SDK。使用过时的版本可能会导致兼容性问题
将图②处的”cn-north-4”修改为实际区域并替换相应的{project_id},服务部署的区域具体请参见终端节点。 单击“Headers”配置项。将获取的Token复制到“X-Auth-Token”值中。 图5 修改配置文件 单击“Body”配置项,将待识别图片的base64编码填写到“image”参数中。
Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-Type 响应消息体的MIME类型。 响应消息体 响应消息体通常以结构化格式返回,与响应消息头中Content-type对应,传递除响应消息头之外的内容。 对于网络图片识别接口,返回如下消息体。
以帮助您安全的控制华为云资源的访问。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户进行权限管理,您可以跳过本章节,不影响您使用OCR服务的其它功能。 通过IAM,您可以在华为云账号中给员工创建IAM用户,并授权控制他们对华为云资源的访问范围。例如,您的员工中有负责
选择“账单管理>流水和明细账单>明细账单”,在如下图所示位置,获取资源名称和区域。 图1 资源名称和区域 单击左侧导航栏的图标,选择“人工智能 > 文字识别 OCR”。 进入文字识别“总览”页面。 选择资源所在的“区域”,单击对应的类别,进入产品列表。 单击对应产品操作列的“开通管理”,在对应账号的操作列单击“取消服务”。
套餐包是一种先付费再使用的计费模式,适用于对资源需求稳定且希望降低成本的用户。通过选择套餐包的计费模式,您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍套餐包OCR资源的计费规则。 适用场景 套餐包计费模式需要用户预先支付一定使用次数的费用,适用于长期、稳定的业务需求。以下是一些适用于套餐包计费模式的业务场景:
THORIZED = "0" 配置认证信息 配置AK、SK、project_id信息。华为云通过AK识别用户的身份,通过SK对请求数据进行签名验证,用于确保请求的机密性、完整性和请求者身份的正确性。 初始化认证信息: const ak = process.env.HUAWEICLOUD_SDK_AK;