检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
与image二选一 图片的URL路径,目前仅支持华为云上OBS提供的匿名公开授权访问的URL以及公网URL。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下: true:校正图片的倾斜角度 false:不校正图片的倾斜角度 支持任意角度的校正,未传入该参数时默认为“false”。
主体识别 功能介绍 用户传入图片通过后台算法判断图片主体,并返回主体坐标,具体识别的主体请参考应用场景。 前提条件 使用主体识别服务之前需要您完成服务申请和认证鉴权。 图像识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调试 您可以在API Exp
身份证识别可以判断身份证真假么 不支持判断身份证的真假,该服务可以识别身份证图片中的文字内容,并将识别的结果以json格式返回给用户。 父主题: 产品咨询类
承兑汇票识别 功能介绍 识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。 约束与限制 只支持中英文。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识
部署服务 评估模板应用后,就可以部署多模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在
网络图片识别 智能分类识别 手写文字识别 身份证识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 车牌识别 名片识别 VIN码识别 增值税发票识别 发票验真 机动车销售发票识别 出租车发票识别 火车票识别 定额发票识别 车辆通行费发票识别 飞机行程单识别 电子面单识别
通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。 通用文字识别 提取图片内的文字及其对应位置信息,并能够根据文字在图片中的位置进行结构化整理工作。 手写文字识别 识别文档中的手写文字信息,并将识别的结构化结果返回给用户。
车辆合格证识别 功能介绍 识别车辆合格证中的文字信息,并返回识别的结构化结果。 约束与限制 只支持中国大陆车辆合格证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 图像中识别区域有效占比超过80%,保证整张车辆合格证内容及其边缘包含在图像内。
Pro控制台查看应用详情,包括应用开发的配置信息和应用资产。 前提条件 已在文字识别套件控制台选择预置工作流新建应用,详情请见新建应用。 进入应用详情页 登录ModelArts Pro管理控制台,单击“文字识别”套件卡片的“进入套件”。 进入文字识别套件控制台。 在左侧导航栏选择“应用开发>工作台”。
、TIFF格式的图片。 图像各边的像素在15到8192px之间。 支持多页同时识别。 能处理反光、暗光、水印等干扰的图片但影响识别精度。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 调用方法 请参见如何调用API。 前提条件 在使用之前,需
ON格式返回识别的结构化结果。 手写文字识别 识别手写文字图片中的文字内容。 证件类 身份证识别 识别身份证图片中正面与反面的文字内容,并返回识别的文字和坐标。 户口本识别 识别户口本中的文字信息,并返回识别的结构化结果。 行驶证识别 识别行驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
是否支持生僻字识别,少数民族字体识别 支持部分生僻字识别。 不支持少数民族语言文字识别。 父主题: API使用类
图像识别价格说明 04 SDK 图像识别SDK是对图像识别提供的REST API进行的封装,以简化用户的开发工作。用户直接调用Image SDK提供的接口函数即可实现使用图像识别业务能力的目的。 SDK文档 媒资图像标签 名人识别 主体识别 翻拍识别 图像标签 常见问题 了解更多常见问题、案例和解决方案
泰文身份证识别 功能介绍 识别泰国身份证中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制。 图1 泰文身份证示例图 使用中国站账号开通泰文身份证识别时,需要在OCR控制台的左上角,将区域切换至“亚太-曼谷”。 图2 切换区域至亚太曼谷 约束与限制
身份证识别,OCR_auto_classification:智能分类识别,OCR-webimage:网络图片识别) 登录我的凭证,获取“华北-北京四”区域的项目ID,替换配置文件URL中的{project_id}。 如您选择的其他区域(非“华北-北京四”),请将图②处的”cn-
OCR服务支持批量识别吗 OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。 父主题: API使用类
文字 文字。 文字块的区域位置 文字块的区域位置。 文字块识别结果 文字块识别结果。 图片朝向 图片朝向。 检测到的文字块数目 检测到的文字块数目。 身份证识别 识别身份证图片中的文字内容,并将识别的结果返回给用户。 输入参数 用户配置身份证识别执行动作,相关参数说明如表5所示。
调用图像识别的API/SDK失败时怎么处理? 检查原因 根据API调用返回结果或者错误码查找原因,具体请参见《图像识别错误码》。 检查访问密钥AK/SK是否获取成功。 检查Token是否填写正确或者已过期。 检查API调用方法是否正确,具体操作请参见《图像识别API参考》。 父主题:
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。