检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一句话识别 http接口 websocket接口
返回状态正常,但识别结果为空 一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致,音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit,目前仅支持16bit位宽的音频,如果低于该位宽的音频,则无法正常识别。
名人识别示例 本章节对名人识别AK/SK方式使用SDK进行示例说明。 名人识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用初始化CelebrityRecognitionReq中的url或image配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
开始识别请求响应 由于WebSocket是全双工的,因此响应就是从服务器端发送给客户端的消息,但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时,会给出如下响应消息,以json字符串形式放置在text message中。 响应消息 表1 响应参数 参数名 参数类型
基本概念、云服务简介、专有名词解释: 文字识别服务 OCR:文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 对象存储服务 OBS:对象存储服务(Object
位置、人脸关键属性。若照片中存在多张人脸,则返回所有符合条件的人脸特征信息。 前提条件: 请确保您已开通人脸识别服务,具体操作方法请参见申请服务。 约束限制: 只支持识别JPG、PNG、JPEG、BMP格式的图片。 application/json请求的body中,请使用标准Json格式。
翻拍识别示例 本章节对翻拍识别AK/SK方式使用SDK进行示例说明。 翻拍识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用RunRecaptureDetectReq中的withUrl或withImage方法配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
名人识别示例 本章节对名人识别AK/SK方式使用SDK进行示例说明。 名人识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用CelebrityRecognitionReq中的withUrl或withImage方法配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
火车票识别 功能介绍 识别火车票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
翻拍识别示例 本章节对翻拍识别AK/SK方式使用SDK进行示例说明。 翻拍识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用初始化RunRecaptureDetectReq中的Image或Url配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
银行卡识别 功能介绍 识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 银行卡示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别JPG、JPEG、PNG、BMP、TIFF格式图片。
名人识别示例 本章节对名人识别AK/SK方式使用SDK进行示例说明。 名人识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用CelebrityRecognitionReq中的url或image方法配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
名人识别示例 本章节对名人识别AK/SK方式使用SDK进行示例说明。 名人识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用初始化CelebrityRecognitionReq中的Image或Url配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
主体识别示例 本章节对主体识别AK/SK方式使用SDK进行示例说明。 主体识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用初始化ImageMainObjectDetectionReq中的url或image配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
主体识别示例 本章节对主体识别AK/SK方式使用SDK进行示例说明。 主体识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用初始化ImageMainObjectDetectionReq中的Image或Url配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
承兑汇票识别 功能介绍 识别承兑汇票识别中的关键字段, 并以json格式返回结构化结果。 约束与限制 只支持中英文。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片。 图像各边的像素大小在15px到8192px之间。 图像
定额发票识别 功能介绍 识别定额发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 定额发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
FunctionGraph,用于实现调用文字识别服务业务逻辑,当收到OBS上传图片通知后,自动调用文字识别 OCR服务进行电子面单识别、网络图片识别并将结果存放在OBS桶内。 使用文字识别 OCR,提供电子面单识别和网络图片识别。用户只需要将电子面单图片或含有收/寄件信息的截图上传至OBS桶,即可自动识别提取收/寄
出租车发票识别 功能介绍 识别出租车发票中的文字信息,并以JSON格式返回识别的结构化结果。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、J
该解决方案基于华为云语音交互服务语音识别构建,可自动将用户上传到对象存储服务的wav语音文件转化为文字,并将结果存放到指定OBS桶。该方案可以将用户上传在OBS的语音文件识别成可编辑的文本,支持中文普通话的识别和合成,其中语音识别还支持带方言口音的普通话识别以及方言(四川话、粤语和上海话)的识别。适用于如