检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
调用API或SDK 在线调试 本地调用
约束与限制 更详细的限制请参见具体API的说明和产品介绍约束与限制。 父主题: 使用前必读
通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Regio
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg:
14:25:10购买了一个时长为1年的身份证 识别套餐包,那么其计费周期为:2023/04/19 14:25:10 ~ 2024/04/19 23:59:59 。 计费示例 假设您在2023/03/08 15:50:04购买了一个增值税发票识别的套餐包(10万次)。购买时长为一年,并在到期前手动续费1年,则:
保证华为云账号不欠费。在使用自定义OCR产品时,需在“文字识别”控制台页面订阅自定义OCR服务。 如果您的账号是IAM账号,在创建应用前,请先使用管理员账号为IAM用户授予文字识别服务(Optical Character Recognition,简称OCR)操作权限权。 操作步骤 在文字识别控制台左侧导航栏选择“自定义OCR”。
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
自定义OCR 自定义OCR介绍 创建应用 通用单模板工作流 多模板分类工作流 字段类型 查看应用详情 常见问题
企业项目管理 应用场景简介 创建企业项目 企业项目财务管理
获取账号ID 在调用接口的时候,部分URL中需要填入账号ID(domain-id),所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下: 注册并登录管理控制台。 单击用户名,在下拉列表中单击“我的凭证”。 在“我的凭证”页面的项目列表中查看账号ID。 图1 查看账号ID
查看应用详情 创建应用后,您可以在“文字识别->自定义OCR”控制台查看应用详情,包括应用开发的配置信息和应用资产。 前提条件 已在“自定义OCR控制台”选择预置工作流创建应用,详情请见创建应用。 进入应用详情页 登录“文字识别”管理控制台,单击左侧菜单的“自定义OCR”。 进入
支持云审计的关键操作 操作场景 平台提供了云审计服务。通过云审计服务,您可以记录与OCR相关的操作事件,便于日后的查询、审计和回溯。 前提条件 已开通云审计服务。 支持审计的关键操作列表 表1 云审计服务支持的OCR操作列表 操作名称 资源类型 事件名称 开通服务 ai_service
cn 身份证识别、驾驶证识别、行驶证识别、增值税发票识别、机动车销售发票识别、通用表格识别、通用文字识别、手写文字识别、车辆通行费发票识别、飞机行程单识别、定额发票识别、出租车发票识别、火车票识别、营业执照识别、银行卡识别、护照识别、道路运输证识别、智能分类识别、车牌识别、名片识别
如果您需要长期使用当前按需购买的文字识别服务,可以将该文字识别服务转为套餐包计费模式,以节省开支。按需计费变更为套餐包会生成新的订单,用户支付订单后,套餐包资源将立即生效。 假设用户于2023/04/18 15:29:16开通了一个按需计费的文字识别服务,由于业务需要,于2023/04/18
常见问题 什么情况下可以使用自定义模板? 如何选取参照字段? 识别结果容易漏字或多识别出内容怎么办? 识别字符出现错误如何优化? 自定义模板OCR取消开通后,是否会将之前创建好的模板删除? 父主题: 自定义OCR
证,通过可视化界面操作,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。 约束与限制 只支持识别PNG、JPG、PNG、BMP、TIFF、GIF、WEBP格式图片。 图像各边的像素大小在100px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。
OCR服务能否实时处理视频流中的文字 OCR不支持读取视频流数据,您可将视频流进行提取帧图片操作,提取出图片后进行识别。 父主题: 产品咨询类
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64
绝的访问操作,以此实现云资源权限访问控制。管理员创建IAM用户后,需要将用户加入到一个用户组中,IAM可以对这个组授予OCR所需的权限,组内用户自动继承用户组的所有权限。 委托授权 如果用户想使用存储在对象存储服务(OBS)上的数据,他可以委托授权OCR服务访问对象存储服务。 父主题:
目前OCR提供的SDK有Java、Python、Node.js、PHP、C++、Go、.NET版本。具体请参考文字识别服务《SDK参考》手册,该手册详细介绍了SDK支持的版本及使用方法。 如果想用其他编程语言调用OCR API服务,可以使用Token鉴权方式,实现接口调用。具体请参考文字识别服务接口《A