检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文字识别控制台 在“我的应用”页签下,单击“创建应用”。 进入“创建应用”页面。 图2 创建应用 您也可以单击“我的工作流”,切换至“我的工作流”页签,选择工作流并单击卡片中的“创建应用”。 根据业务需求填写“应用名称”、“应用负责人”和“应用描述”,仅支持英文、中文、数字、下划线、中划线。选择“所属行业”及工作流。
携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数
OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。 表1 OCR的数据保护手段和特性
套餐包是一种先付费再使用的计费模式,适用于对资源需求稳定且希望降低成本的用户。通过选择套餐包的计费模式,您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍套餐包OCR资源的计费规则。 适用场景 套餐包计费模式需要用户预先支付一定使用次数的费用,适用于长期、稳定的业务需求。以下是一些适用于套餐包计费模式的业务场景:
access."表示用户没有编程访问权限。 子用户没有编程访问权限,需要联系主账户进行权限设置。 主账户在统一身份认证服务界面,选择对应的子用户操作列的“安全设置”进入设置界面。 图1 编程访问权限设置 父主题: Token认证鉴权类
统计API使用量 文字识别控制台 > 服务监控支持查看API的总调用量、调用成功量、调用失败量。 如果您购买了套餐包,可在“套餐包管理”页面,查看已有的套餐包及使用详情。套餐包费用扣减规则请参见“产品介绍 > 计费说明”。 图1 服务监控
运行时请确保文件路径 d:/demo.jpg 是正确的,并且文件确实存在于此路径下。部分 Windows 环境下字符编码的默认设置可能与代码不兼容,导致读取后的解码报错。这种情况下可以尝试将代码中的decode()修改为decode('utf-8')来匹配适合的字符编码。 图1 运行示例 父主题:
打开用户组列表,找到子用户所在的用户组,单击该用户组的“授权”操作。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权。OCR全部系统权限请参见权限管理。 当现有策略不满足时,可使用OCR自定义策略 IAM用户被赋予相应权限后,可使用IAM用户登录OCR控制台,开通所需的服务。 主账户帮IAM用户开通OCR服务
OCR自定义策略 如果系统预置的权限,不满足您的授权要求,可以创建自定义策略。自定义策略中可以添加的授权项(Action)请参见权限管理。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。
计费样例 计费场景 某用户于2023/03/18 15:30:00开通了华北-北京四的通用文字识别API。 成功调用5000次之后,用户发现此服务识别效果可以满足业务需求,因此打算长期使用下去,并于2023/03/20 10:30:00将通用文字识别转为套餐包计费(10万次套餐包,3
创建企业项目后,在传参时,有以下三类场景。 携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
与image二选一。 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 detect_direction 否 Boolean 校正图片的倾斜角度开关,可选值如下所示: true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角度的校正,未传入该参数时默认为“false”。
与image二选一 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下: true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角度的校正,未传入该参数时默认为“false”。
创建企业项目后,在传参时,有以下三类场景。 携带正确的ID,正常使用OCR服务,账单的企业项目会被分类到企业ID对应的企业项目中。 携带格式正确但不存在的ID,正常使用OCR服务,账单的企业项目会显示对应不存在的企业项目ID。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
种版式。 单模板的前提: 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。 识别文字内容不能偏离设定的识别区域,包括打印偏移、由上下文长度变化引起的偏移等。 多模板的前提: 分类器中的任一模板,均需满足上述单模板的要求。 模板种类固
服务开通类 如何选购合适的API 如何关闭已申请的服务 开通按钮置灰,如何处理 服务开通之后开通状态显示「未开通」 如何选择OCR套餐包的区域
产品咨询类 OCR服务支持上传图片后直接导出结果吗 OCR服务能否实时处理视频流中的文字 通用表格识别是否支持导出为excel格式 使用OCR服务是否必须使用华为云存储图片 OCR服务可以识别文本格式文件吗 接口返回时间较长,如何提高响应速度 OCR服务是否支持二维码识别 OCR服务是否支持离线使用
API使用类 如何查看API的使用量 为什么实际调用次数与界面记录次数不一致 API是否可以混用 OCR服务支持批量识别吗 OCR服务识别结果可以转化为Word、TXT、pdf吗 如何获取图片base64编码 OCR的并发是多少 调用OCR服务的区域可以与OBS资源的区域不一致吗 识别身份证正反面总计调用几次接口