搜索_华为云

开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。 vad_head 否 Integer 一段音频的开头，当它的静音持续时间大于等于此值时，在实时语音识别单句模式下将返回“长时间静音”事件并结束识别，在连续模式下将会断句并继续下一句的识别。如果设置为0，表示不检测“长时间静音”情况。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
录音文件识别 - 语音交互服务 SIS

表4 响应结果参数名称是否必选参数类型描述 status 否 String 当前识别状态。具体状态如下所示： WAITING 等待识别。 FINISHED 识别已经完成。 ERROR 识别过程中发生错误。 create_time 否 String 任务创建时间, 遵循 RFC

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

描述返回状态。 WAITING 等待识别。 FINISHED识别已经完成。 ERROR 识别过程中发生错误。 createTime 否 String 任务创建时间。格式如2018-12-04T13:10:29.310Z。 startTime 否 String 开始识别时间。格式如2018-12-04T13:10:29

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
提交录音文件识别任务 - 语音交互服务 SIS

提交录音文件识别任务录音文件识别接口，用于识别长录音文件，支持中文普通话、四川话识别。录音文件放在OBS（对象存储服务）或公网可访问的服务器上。由于录音文件识别通常会需要较长的时间，因此识别是异步的，即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
获取录音文件识别结果 - 语音交互服务 SIS

户服务器。使用get接口查询，不会出现该字段。 status 否 String 当前识别状态。具体状态如下所示： WAITING 等待识别。 FINISHED 识别已经完成。 ERROR 识别过程中发生错误。 create_time 否 String 任务创建时间，遵循 RFC

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > 语音交互服务 SIS > API参考
实时语音识别单句模式 - 语音交互服务 SIS

段语音的结束点，就会将当前这一段的识别结果返回。和连续识别不同的是，在单句模式下，返回第一段的识别结果后，将不再继续识别后续的音频。这主要是用于和用户进行语音交互的场景下，当用户说完一句话后，往往会等待后续的交互操作，例如聆听根据识别结果播报的相关内容，因而没有必要继续识别后续的音频。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
使用实时语音识别 - 语音交互服务 SIS

音频格式，支持pcm等，如pcm8k16bit，参见《API参考》中开始识别章节。 property 是 String 属性字符串，language_sampleRate_domain，如chinese_8k_common，参见《API参考》中开始识别章节。通过set方法可以设置具体参数，详见表 RasrRequest设置参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
实时语音识别 - 语音交互服务 SIS

实时语音识别支持“华北-北京四”、“华东-上海一”区域。当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
实时语音识别 - 语音交互服务 SIS

见《API参考》中开始识别章节。 property 是 String 属性字符串，language_sampleRate_domain，如chinese_16k_general，参见《API参考》中开始识别章节。 punc 否 String 表示是否在识别结果中添加标点，取值为yes

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
实时语音识别 - 语音交互服务 SIS

参考》中开始识别章节。 model_property 是 String 属性字符串，language_sampleRate_domain，如chinese_16k_general，参见《API参考》中开始识别章节。 add_punc 否 String 表示是否在识别结果中添加标点，取值为yes

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
一句话识别Http接口 - 语音交互服务 SIS

eneral。具体信息请参见《API参考》中一句话识别章节。 add_punc 否 String 表示是否在识别结果中添加标点，取值为yes 、 no，默认no。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
使用实时语音识别 - 语音交互服务 SIS

音频格式，支持pcm等，如pcm8k16bit，参见《API参考》中开始识别章节。 property 是 String 属性字符串，language_sampleRate_domain，如chinese_8k_common，参见《API参考》中开始识别章节。通过set方法可以设置具体参数，详见表 RasrRequest设置参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
实时语音识别连续模式 - 语音交互服务 SIS

果检测到一段语音的结束点，就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识别模式中，可能多次返回识别结果。如果送入的一段语音较长，甚至有可能在一次返回中包括了多段的识别结果。由于引入了静音检测，连续识别模式通常会比流式识别能具有更高的效率，因为对于静

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别连续模式 - 语音交互服务 SIS

API参考》中开始识别章节。 property 是 String 属性字符串，language_sampleRate_domain，如chinese_16k_general，参见《API参考》中开始识别章节。 addPunc 否 String 表示是否在识别结果中添加标点，取值为yes

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

http接口功能介绍一句话识别接口，用于短语音的同步识别。一次性上传1min以内音频，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用调试您可以在API

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
websocket接口 - 语音交互服务 SIS

要实时反馈的情况下100ms，不需要实时反馈的情况下500ms。结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "结束识别"请求使用文本类型的数据帧(text message)发送，命令和参数以json字符串的形式提供。

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

应用场景语音客服质检识别客服、客户的语音，转换为文本。进一步通过文本检索，检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件，进行快速的识别，转化成文字，方便进行会议记录。语音短消息通过语音发送或者接收短消息时，将音频短消息转文字，提升阅读效率和交互体验。

帮助中心 > 语音交互服务 SIS > 产品介绍

总条数： 62

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开始识别 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

获取录音文件识别结果 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线