检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片。 图像各边的像素大小在15到8192px之间。 图像中有效文字图片占比超过60%,避免有效文字图片占比过小。 支持图像中有效文字图片的任意角度的水平旋转(需开启方向检测)。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
实施步骤 准备工作 快速部署 开始使用 快速卸载
实施步骤 准备工作 快速部署 开始使用 快速卸载
cribe 取消开通通用文字识别服务 √ × ocr:generalText:getSubscribeUserList 查询开通通用文字识别的用户列表 √ √ ocr:generalText:subscribeAllUsers 为其余子用户开通通用文字识别服务 √ × ocr:g
字符,支持小写字母、数字、中划线(-)、英文句号(.),禁止以中划线(-)或英文句号(.)开头及结尾。 空 登录华为云解决方案实践,选择“文字识别-快递电子面单识别”,单击“一键部署”,跳转至解决方案创建堆栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板
在AstroZero中,通过应用与OCR对接,可实现图片或扫描件中文字识别功能。例如,识别某用户上传到华为OBS上的身份证图片的全部信息。 前提条件 已申请身份证识别服务,具体操作请参见开通文字识别服务。 图1 已申请身份证识别服务 已获取AK(Access Key ID)、SK(Secret
OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 关于文字识别的相关声明请参见文字识别服务声明。 文字识别服务等级协议请参见华为云服务等级协议。
受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过
提取图片中的文字暗水印 功能介绍 对已嵌入文字暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以JSON的格式返回从图片里提取的出的文字暗水印。目前支持的图片格式为:*.jpg, *.jpeg, *.jpe, *.png, *.bmp, *.dib
对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。 通用文字识别 识别图片上的文字内容,并返回识别的文字和坐标。 网络图片识别 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别。
通过OBS方式传入图片报错FRS.0022怎么办 问题原因 OBS路径错误。 OBS桶并不是当前用户的桶。 注册服务时,没有将OBS权限授予FRS服务。 解决方案 图片的路径按照“/bucket/image-path”格式,不需要带上域名。 人脸服务只能访问当前账号的OBS桶。
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模
上传待识别发票 选择用于存放结果的“ocr-invoice-result-bucket”桶,即可自动获取该发票的识别与验真结果,以发票文件名称为前缀的JSON文件存储。 图3 获取识别结果文件 通过华为云SDK使用 企业业务系统可通过华为云提供的SDK服务与OBS桶进行对接,当员工上
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分
识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件提供预置工作流供您选择,全流程可视化完成AI应用开发以及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。
修订记录 发布日期 修订记录 2023-04-30 第一次正式发布。
修订记录 表1 修订记录 发布日期↵ 修订记录↵ 2022-03-30 第一次正式发布。↵ 2023-03-08 修订实施步骤。 2024-08-22 适配函数工作流EventGrid触发器。
资源和成本规划 该解决方案主要部署如下资源,以下花费仅供参考,具体请参考华为云官网价格详情,实际收费以账单为准: 表1 资源和成本规划 华为云服务 计费说明 每月花费(调用1000次) 文字识别服务 增值税发票识别: 0.18元/次 发票验真:0.23元/次 410元 对象存储服务 数据存储(多AZ存储):0
requirements. 图片尺寸不满足要求。 请检查图片尺寸,各服务支持图片尺寸请参考使用限制。 AIS.0104 The image is not supported or the image quality is poor. 非支持的图片类型或图片质量差。 请检查图片类型与图片质量。 请检查调用的接口是否正确。