检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,详情请见上传模板图片。
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并上传模板图片,详情请见上传模板图片。
这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并框选参照字段,详情请见框选参照字段。 操作步骤
评估 模板总览过后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并已框选识别,详情请见模板总览。
评估 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成框选识别区步骤,详情请见框选识别区。 进入评估页面
套餐包 套餐包是一种先付费再使用的计费模式,适用于对资源需求稳定且希望降低成本的用户。通过选择套餐包的计费模式,您可以预先购买云服务资源并获得一定程度的价格优惠。本文将介绍套餐包OCR资源的计费规则。 适用场景 套餐包计费模式需要用户预先支付一定使用次数的费用,适用于长期、稳定的
未缴清欠款,将进入保留期。保留期内客户不能访问及使用云服务,但对客户存储在云服务中的数据仍予以保留。云服务进入宽限期/保留期后,华为云将会通过邮件、短信等方式向您发送提醒,提醒您续订或充值。保留期到期仍未续订或充值,存储在云服务中的数据将被删除、云服务资源将被释放。 父主题: 计费FAQ
责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。
参数类型 说明 image 否 String 该参数与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于15px,最长边不超过8192px,支持JPEG、JPG、PNG、BMP、TIFF格式。 图片Base64编码示例如/9j/4AAQSkZJRgABAg
本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。 操作步骤 登录云审计服务控制台。 单击左侧导航树的“事件列表”,进入事件列表信息页面。 事件列表支持通过筛选来查询对应的操作事件。当前事件列表支持四个维度的组合查询,详细信息如下: 事件来源、资源类型和筛选类型。 在下拉框中选择查询条件。 其
D。 不携带ID或格式错误ID(包含特殊字符等),正常使用OCR服务,账单的企业项目会被分类到"default"中。 表3 请求Body参数 参数 是否必选 参数类型 描述 image 否 String 与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。
根据工作流指引,创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 通用单模板工作流 多模板分类工作流 根据工作流指引,创建多模板服务,通过多模板训练模板分类器和文字识别模型,实现多模板图像的文字信息结构化提取。 多模板分类工作流 调用API 调用指南,支持通过API调用当前模板服务。
OBS特性的使用限制请参考约束与限制。 开启公共读授权(可选) 配置公共读可参考《对象存储服务控制台指南》配置标准桶策略,创建桶策略为“公共读”。一般私密数据不建议用此方法。 “私有桶”策略(可选) OCR识别OBS私有桶中的图片时需要保证调用OCR服务的账号和调用OBS服务的账号为同一个。 使用临时授权请求鉴权
效果。 通过可视化工具(如curl、Postman)发送请求调用OCR服务API。 如果您是开发工程师,熟悉代码编写,熟悉HTTP请求与API调用,您可以通过postman调用、调试API。使用方法请参见调用API实现身份证识别,视频指导请参见API使用指导视频。 通过软件开发工具包(SDK)调用OCR服务API。
参数类型 说明 image 否 String 该参数与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于100px,最长边不超过8192px,支持JPEG、JPG、PNG、BMP、TIFF、PDF、OFD格式,多页PDF仅识别第一页。 图
true:返回校验信息 false:不返回校验信息 return_text_location 否 Boolean 识别到的文字块的区域位置信息。可选值包括: true:返回各个文字块区域 false:不返回各个文字块区域 如果无该参数,系统默认不返回文字块区域。如果输入参数不是Boolean类型,则会报非法参数错误。
客票号码、验证码、提示信息、保险费、销售单位代号、填开单位、填开日期、始发站、目的站、承运人、航班号、座位等级、日期、时间、客票类别、客票生效日期、有效截止日期、免费行李。 同时,支持单张行程单上的多航班信息识别。 该接口的应用场景广泛,可应用于企业内部报销、个人行程规划与记录类
目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 数据传入方式 使用OCR API或SDK时,数据主要通过以下两种方法传入。 image 传入图片的base64编码。 您可以通过在线转码工具,浏览器,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。
权限类 使用OCR服务需要的权限 如何通过主账号创建IAM账号 无权在控制台服务监控查看数据
用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明、隐私政策声明。