检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持云审计的关键操作 操作场景 平台提供了云审计服务。通过云审计服务,您可以记录与OCR相关的操作事件,便于日后的查询、审计和回溯。 前提条件 已开通云审计服务。 支持审计的关键操作列表 表1 云审计服务支持的OCR操作列表 操作名称 资源类型 事件名称 开通服务 ai_service
说明 URI-scheme 表示用于传输请求的协议,当前所有API均采用HTTPS协议。 endpoint 指定承载REST服务端点的服务器域名或IP,不同服务不同区域的endpoint不同,您可以从终端节点章节查看。 例如OCR服务在“华北-北京四”区域的“endpoint”为“ocr
只支持识别JPG、JPEG、PNG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 只支持识别银行卡正面,不支持识别背面。 只支持识别85.60×53.98 mm常规大小的银行卡,不支持迷你卡和形状不规则的异形卡。 支持图像中银行卡任意角度的水平旋转。 文字识别服务属于公有云服务,线上
开通服务 在华为云官网注册华为云账号,并登录。账号不能处于欠费或冻结状态。 创建IAM账号(可选): 登录华为云控制台,在右上角用户名处选择“统一身份认证”。 图1 统一身份认证 单击“创建用户”,并设置IAM账户的用户名、密码,创建IAM用户。 图2 创建用户 图3 设置用户名、密码
按需付费,用户只需花费少量成本,即可代替发票的人工录入以及真伪审核,提升业务效率以及防止税务合规风险。 约束与限制 该方案当前仅支持华北-北京四区域。 在使用之前,请注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 该方案支持识别发票图片,发票PDF、OFD文件。其中,图片支持JPEG
增值税发票识别支持哪些发票 目前已经支持增值税专用发票和增值税普通发票(含电子普通发票)。卷式发票和通行费发票即将上线,并且支持发票备注、监制章、专用章、发票联次等字段。具体请参见增值税发票识别章节。 父主题: 产品咨询类
名片识别 功能介绍 识别名片图片上的文字信息,并以JSON格式返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 名片示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
通用表格识别是否支持导出为excel格式 通用表格识别支持将表格内容转换成可编辑的Excel格式,传入参数return_excel为true时,将返回的表格转换为Microsoft Excel对应的base64编码,可用Python函数 base64.b64decode解码后保存为
是否支持从非华为云存储中读取图片 OCR服务支持读取公网http和https的图片地址,如果使用非华为云存储,请确保相应的图片可以通过公网进行访问。 父主题: API使用类
OCR是否支持事业单位和社会团体营业执照识别 OCR服务无事业单位和社会团体营业执照识别单独的API,建议使用智能文档解析API调试。 父主题: 产品咨询类
可使用OCR服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 表1 文字识别的终端节点 区域名称 区域 终端节点(Endpoint) 部署服务 华北-北京一 cn-north-1 ocr.cn-north-1.myhuaweicloud
图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 单页字符数不大于1800,以获得较优的识别效果。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文档解析。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
应用场景简介 OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。企业可以根据组织架构规划不同的企业项目,并为每个企业项目设置拥有不同权限的用户组和用户,多个企业项目之间相互独立,资源分开结算。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企
图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 支持自动过滤浅色文字水印。 目前不支持复杂背景(如户外自然场景等)和文字扭曲图像的文字识别。 支持中英文以及部分繁体字、马来语、乌克兰语、印地语、俄语、越南语、印尼语、泰语、阿
Java SDK 本章节介绍新版Java SDK,您可以参考本章节进行快速集成开发。 准备工作 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 已具备开发环境,支持Java JDK 1.8 及其以上版本。 登录“我的凭证 > 访问密钥”页面,依据界面操作指引获取Access
网络图片识别 功能介绍 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。 该接口支持字体分类功能,支持竖行文本识别。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。
Not Found 所请求的资源不存在。 建议直接修改该请求,不要重试该请求。 405 Method Not Allowed 请求中带有该资源不支持的方法。 建议直接修改该请求,不要重试该请求。 406 Not Acceptable 服务器无法根据客户端请求的内容特性完成请求。 407
图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 数据传入方式 使用OCR API或SDK时,数据主要通过以下两种方法传入。
解读识别结果 本章节通过网络图片识别API介绍如何解读调API返回的JSON格式识别结果。请参照API参考“响应参数”章节比对查看。 以下图识别结果为例,讲解图片内容如何与API的返回字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含
进入文字识别控制台。打开对象存储服务OBS授权的按钮,完成授权操作。完成授权即可使用授权方式的URL对服务进行访问。 图1 OBS授权 不支持跨区域OBS,OBS的区域需要和服务保持一致。 OBS特性的使用限制请参考约束与限制。 开启公共读授权(可选) 配置公共读可参考《对象存储