检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图解文字识别
数据保护技术 OCR服务处理以下类型的数据: OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全
image image = cv2.imread('test.png') image = resize_image(image, max_size=1024) 父主题: API使用类
使用流程简介 文字识别是指对图像中的打印字符进行检测识别,通过调用API,识别图片中的文字,并返回JSON格式的识别结果。 使用流程 图1 使用流程 使用前必读 用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。 OCR服务需要用户通过调用
输入数据可选image或url,本示例使用url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0282767866.png。 复制代码示例至PyCharm中。
图3 配置参数 表1 参数说明 参数名称 类型 是否可选 参数解释 默认值 image_bucket_name string 必填 桶名称,用于上传发票图片或PDF文件。 OBS桶名称,全局唯一,用于上传发票图片或PDF文件。
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。 通用文字识别
图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。
AIS.0102 The image format is not supported. 图片格式不支持,或image参数值不是base64编码字符串。 请检查图片格式,各服务支持图片格式请参考使用限制。
从具体API的URI章节获取,例如网络图片识别API的“resource-path”为“v2/{project_id}/ocr/web-image”。 query-string 查询参数,是可选部分,并不是每个API都有查询参数。查询参数前面需要带一个“?”
输入数据可选image或url,本示例使用url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0288038182.png。 单击“调试”按钮,获取识别结果。 父主题: 调用API或SDK
如何提高识别精度 尽量使用文字清晰度高、无反光的图片。进行图片采集时,尽量提高待识别文字区域占比,减少无关背景占比,保持图片内文字清晰人眼可辨认。 若图片有旋转角度,算法支持自动修正,建议图片不要过度倾斜。 图片尺寸方面,建议最长边不超过8192像素,最短边不小于15像素,图像长宽比例维持常见水平
Body部分填入image的base64编码或url均可,其它参数根据实际情况选填,参数部分可参考APIE界面的“接口文档”。 单击调试,在“调试结果”中查看调用结果。 图1 APIE在线调试 父主题: 如何调用API
输入数据可选image或url,本示例使用url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0282767866.png。 复制代码示例至PyCharm中。
/gif、image/jpeg、image/png、image/tiff。
{ "error_code": "AIS.0103", "error_msg": "The image size does not meet the requirements." } 其中,error_code表示错误码,error_msg表示错误描述信息。
自定义OCR介绍 OCR自定义模板将于2025.12.31正式下线,为避免影响您目前的业务,请您及时进行相关迁移工作,迁移指导详见OCR自定义模板下线公告。 自定义OCR基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取
图片质量类报错处理办法 问题现象 调用文字识别API时,产生以下图片质量类报错。 错误码AIS.0102:图片格式不支持。 错误码AIS.0103:图片尺寸不满足要求。 错误码AIS.0104:非支持的图片类型或图片质量差。 解决方法 请参考产品介绍 > 约束与限制章节检查图片的格式
获取识别结果 解读识别结果 识别结果后处理
Request Body: { "image" : "/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA...