检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图1 通用文字示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD、PDF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时,集成开发环境CloudIDE,可完成代码的构建、调试、运行。 本章节以通用文字识别为例,介绍如何使用API Explorer调试API。
图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。 只支持识别JPG、JPEG、PNG、BMP、TIFF、TGA、WEBP、ICO、PCX、GIF格式图片。 支持常见网络图片:手机截图、电脑截图、电商产品图及广告设计图等互联网图片。
支持区域: 华北-北京四 通用文字识别API 网络图片识别 支持识别网络图片中的所有印刷体、艺术字等文字信息,可识别中英文及部分繁体字以及常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片,能够返回位置坐标和置信度,方便用户进行版式的二次处理以及提高人工校验效率
01:59 非支持的图片类型报错
产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR 01 了解 了解华为云文字识别服务的产品介绍、应用场景、使用限制,有助于更好的使用文字识别服务。
约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到4096px之间。 图像中车牌区域有效占比超过10%,保证所有文字及其边缘包含在图像内。 推荐图像中车牌清晰无遮挡、正面放置无倾斜。
图1 通用表格示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。 支持图像任意角度的水平旋转。
图1 手写文字示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转(需开启方向检测)。
由浅入深学习 您可以参考成长地图,由浅入深学习使用OCR。
图1 API Explorer 与API的对应关系 文字识别接口与API对应关系请参见表2。
图像各边的像素大小在15px到8192px之间。 图像中身份证区域有效占比超过25%,保证整张身份证内容及其边缘包含在图像内。 支持图像中身份证任意角度的水平旋转。 支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。
您可以通过在线体验,体验接口的识别效果。 对于固定板式的图片,如果当前接口不满足您的业务需求,可以使用ModelArts Pro服务提供的文字识别套件,零代码搭建出专属的API,详细操作请参见视频指导。
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg
只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在100px到8192px之间。 图像中行驶证区域有效占比超过5%,保证整张行驶证内容及其边缘包含在图像内。 支持图像中行驶证任意角度的水平旋转。
驾驶证识别 功能介绍 识别驾驶证图片中主页与副页的文字内容,并将识别的结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。
图4 评估模板 本地上传图片 默认进入“本地上传”页签,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传在线图片 单击“在线URL”,切换至“在线URL”页签。
上传在线图片 在“应用开发>评估”页面,单击“在线URL”,切换至“在线URL”页签。 图3 上传在线图片 在“开始识别”左侧输出框中输入待测试的图片URL地址,或者拖拽测试图片至虚线框内上传图片区域。 单击“开始识别”,右侧会显示识别结果。
如何获取图片base64编码 OCR服务的输入图片参数是图片的base64编码,本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。
图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。 支持图像任意角度的水平旋转。