检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务是否支持二维码识别 不支持二维码识别。 父主题: 产品咨询类
华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
照片数字人 制作照片数字人视频 查看任务 查看视频
实时语音识别响应 开始识别请求响应 事件响应 识别结果响应 错误响应 严重错误响应 结束识别请求响应 父主题: 实时语音识别接口
图像标签(V2) 图像标签服务准确识别自然图片中数百种场景、上千种通用物体及其属性,让智能相册管理、照片检索和分类、基于场景内容或者物体的广告推荐等功能更加直观。
人脸识别服务是否支持私有化部署 人脸识别服务暂不支持私有化部署。人脸识别以开放API的方式提供给用户,用户通过实时访问和调用API获取人脸处理结果,帮助用户自动进行人脸的识别、比对以及相似度查询等。 父主题: 产品咨询类
return_portrait_image 否 Boolean 是否返回身份证头像照片的 Base64 编码,可选值如下: true:返回身份证头像照片的 Base64 编码 false:不返回身份证头像照片的 Base64 编码 未传入该参数时默认为false,即不返回身份证头像照片的
附录 名词解释 基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。
创建照片分身数字人视频制作任务 功能介绍 该接口用于创建照片分身数字人视频制作任务。 调用方法 请参见如何调用API。
创建照片建模任务 功能介绍 该接口用于创建风格化照片建模任务。通过上传照片,生成风格化数字人模型。 调用方法 请参见如何调用API。
true:表示取消识别,也即丢弃识别中和未识别的语音数据并结束,不返回剩余的识别结果。 false:表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。 默认是false。
使用约束 营业执照照片识别目前因为OCR服务只支持部分区域,所以只有部分区域支持识别,支持的区域请参见OCR支持区域。
pdf_page_number 否 Integer 指定PDF页码识别。传入该参数时,则识别指定页码的内容。如果不传该参数,则默认识别第1页。
定额发票识别 功能介绍 识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 定额发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。
VIN码识别 功能介绍 识别图片中的车架号信息,并将识别结果以JSON格式返回给用户。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 VIN码示例图 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
请确保音频位宽为16bit,目前仅支持16bit位宽的音频,如果低于该位宽的音频,则无法正常识别。 父主题: API使用类
照片建模任务详情查询 功能介绍 该接口用于风格化查询照片建模任务详情。 调用方法 请参见如何调用API。
为什么使用人脸识别返回数据为空 问题现象 上传照片中的人像可能存在横置或倒置等情况。 解决方法 尽量选择纯色无干扰背景,保证图片中人像清晰。 上传的人脸图片要求:侧脸不超过30°,抬头低头不超过15°。
一句话识别 http接口 websocket接口
如果检测语音结尾的静音时长大于等于此值时,在实时语音识别单句模式下将返回VOICE_END(识别结果非空)或EXCEEDED_SILENCE(识别结果为空)事件并结束识别,在连续模式下将会断句并继续下一句的识别。