检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手写文字识别 功能介绍 识别文档中的手写文字、印刷文字信息,并将识别的结构化结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
证件类 证件类 证件类OCR(Card OCR),支持身份证识别、行驶证识别、驾驶证识别、护照识别、银行卡识别、营业执照识别、名片识别、车牌识别、VIN码识别、道路运输证识别、道路运输从业资格证识别等卡证图片上有效信息的自动识别和关键字段结构化提取。
主体识别 功能介绍 用户传入图片通过后台算法判断图片主体,并返回主体坐标,具体识别的主体请参考应用场景。 前提条件 使用主体识别服务之前需要您完成服务申请和认证鉴权。 图像识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
票据类 票据类 票据类OCR(Receipt OCR),支持增值税发票识别、定额发票识别、出租车发票识别、火车票识别、飞机行程单识别、机动车销售发票识别、车辆通行费发票识别以及发票验真,支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。
护照识别 功能介绍 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 当前版本支持2012年及以后发行的中国普通电子护照的全字段识别。中国-港澳台地区、外国护照支持护照下方两行国际标准化的机读码识别,并可从中提取7个关键字段信息。
支持中文普通话、带方言口音的普通话以及方言,方言当前支持四川话、粤语和上海话识别。
用户直接调用人脸识别SDK提供的接口函数即可实现使用人脸识别服务业务能力。
查看详情 实时语音识别、录音文件识别常见问题解答 实时语音识别、录音文件识别常见问题解答 实时语音识别服务支持哪些语言? 录音文件识别、语音合成支持中文普通话。 一句话识别和实时语音识别支持中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。
增值税发票识别 功能介绍 识别增值税发票的类别,并以JSON格式返回识别的结构化结果,支持识别图片、PDF、OFD文件。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 发票验真API请参见发票验真。
道路运输从业资格证识别 功能介绍 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果。 图1 道路运输从业资格证示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。
园区出入管理 使用人脸比对,人脸搜索对来访人员进行分析,识别外来访客与园区人员,进行安全监控。 表情识别 身份验证 考试防作弊 人脸闸机 电子考勤 园区出入管理 表情识别 文档与学习成长 快速入门 快速入门 如何在线调试人脸识别服务?
使用指导 文字识别 OCR 使用API 文字识别API使用指导 文字识别 OCR 使用SDK 06:38 文字识别 OCR 使用SDK 文字识别SDK使用指导 文字识别 OCR 使用API 03:04 文字识别 OCR 使用API 文字识别API使用指导
方案咨询 语音交互服务清单及功能对比 服务 功能 适用场景 支持语言 实时语音识别 可将不限时长的音频流实时识别为文字,识别结果自动断句。 适用于直播实时字幕、现场会议实时记录、演讲实时转写等场景。 支持中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。
云容器引擎-成长地图 | 华为云 图像识别 图像识别(Image Recognition),基于深度学习技术,可准确识别图像中的视觉内容,提供多种物体、场景和概念标签,具备目标检测和属性识别等能力,帮助客户准确识别和理解图像内容。
功能介绍 实时语音识别 实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言和英语,方言当前支持四川话、粤语和上海话。 文本时间戳 为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频。
护照识别 针对中国护照,可识别护照上的全部信息;针对其他国家护照,可根据两行国际标准化的机读码识别出6-7个关键字段信息,包括姓名、性别、出生日期、护照号码、签发国国家码、护照有效期等。在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别护照信息。
通用类 通用类 通用类OCR(General OCR),支持通用文字识别、通用表格识别、网络图片识别、智能分类识别、手写文字识别等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。
核酸检测记录识别 功能介绍 支持对全国各地不同版式的核酸检测记录中的4个关键字段进行结构化识别,包括姓名、核酸检测采样时间、检测检测结果更新时间、核酸检测结果(阳性、阴性、未知) 图1 核酸检测记录版式示例 防疫健康码识别已推出三码合一功能(健康码、核酸检测记录、行程卡)。
名片识别 功能介绍 识别名片图片上的文字信息,并以JSON格式返回识别的结构化结果。支持对多种不同版式名片进行结构化信息提取。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。