搜索_华为云

一句话识别Websocket接口 - 语音交互服务 SIS

SasrWebsocketRequest。表3 SasrWebsocketRequest 参数名称是否必选参数类型描述 audio_format 是 String 音频格式，支持pcm，alaw，ulaw等，如pcm8k16bit，具体规格请参见《API参考》中开始识别章节。 model_property 是

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别极速版接口 - 语音交互服务 SIS

audio_format取值范围 audio_format取值描述 wav wav格式音频。 mp3 mp3格式音频。 m4a m4a格式音频。 acc acc格式音频。 opus opus格式音频。表5 property取值范围 property取值描述 chinese_8k_common

帮助中心 > 语音交互服务 SIS > API参考
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
使用实时语音合成 - 语音交互服务 SIS

RttsRequest设置参数表3 RttsRequest设置参数方法名称是否必选参数类型描述 SetAudioFormat 否 String 设置语音格式，默认pcm。 SetAudioProperty 否 String 设置语音合成特征字符串，{language}_{speaker}_{d

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
流式一句话 - 语音交互服务 SIS

最终结果的时间）即可返回最终识别结果。这种流式输入方式能缩短整体上获得最终结果的时间，极大地提升用户体验。 wss-URI wss-URI格式 wss /v1/{project_id}/rasr/short-stream 参数说明表1 参数说明参数名是否必选说明 project_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
录音文件极速版 - 语音交互服务 SIS

wav 表4 audio_format audio_format取值描述 wav wav格式音频 mp3 mp3格式音频 m4a m4a格式音频 aac aac格式音频 opus ops格式音频。表5 property property取值描述 chinese_8k_common

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
数据保护技术 - 语音交互服务 SIS

不作保留，识别返回后立即释放。服务声明请参见：https://www.huaweicloud.com/declaration/sis.html 父主题：安全

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
使用实时语音识别 - 语音交互服务 SIS

RasrRequest。表2 RasrRequest 参数名称是否必选参数类型描述 audioFormat 是 String 音频格式，支持pcm等，如pcm8k16bit，参见《API参考》中开始识别章节。 property 是 String 属性字符串，languag

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
实时语音合成 - 语音交互服务 SIS

配置信息。请参考表 config数据结构。表4 Config 名称参数类型是否必选说明 audio_format String 否语音格式头：pcm、alaw、ulaw。默认：pcm sample_rate String 否采样率：16000、8000。默认：8000 property

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
开始语音合成请求 - 语音交互服务 SIS

Object 否配置信息。请参考表2。表2 config数据结构名称参数类型是否必选说明 audio_format String 否语音格式头：pcm、alaw、ulaw、mp3。默认：pcm sample_rate String 否采样率：16000、8000赫兹。默认：8000

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
示例音频 - 语音交互服务 SIS
示例音频 - 语音交互服务 SIS

测试音频如表示例音频所示，音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k，位宽为16bit。表1 示例音频音频格式下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud.com/16k16bit

帮助中心 > 语音交互服务 SIS > SDK参考 > 附录
示例音频 - 语音交互服务 SIS
示例音频 - 语音交互服务 SIS

测试音频如表示例音频所示，音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k，位宽为16bit。表1 示例音频音频格式下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud.com/16k16bit

帮助中心 > 语音交互服务 SIS > API参考 > 附录
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

获取Websocket握手请求wss-URI请参见Websocket握手请求。获取实时语音识别请求消息格式信息请参见实时语音识别请求。获取实时语音识别响应消息格式请参见实时语音识别响应。客户端通过Websocket协议访问实时流转写接口时，连接时长不能超过5小时。超过5

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
一句话识别Websocket接口 - 语音交互服务 SIS

SasrWebsocketRequest。表3 SasrWebsocketRequest 参数名称是否必选参数类型描述 audioFormat 是 String 音频格式，支持pcm，alaw，ulaw等，如pcm8k16bit，具体规格请参见《API参考》中开始识别章节。 property 是 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
一句话识别 - 语音交互服务 SIS

一句话识别前提条件确保已经按照配置好iOS开发环境。已经保存好1分钟内音频文件，建议使用16k16bit进行录音并保存为wav格式。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SASRClient，参数为AuthInfo，详见表1。

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
录音文件识别极速版 - 语音交互服务 SIS

当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。支持从华为云对象存储服务（OBS）下载音频，需要用户提供OBS桶名和对象键值。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

0535 录音文件识请求的文件类型不支持。确保设置的audio_format格式的值是合法。录音文件识别支持的音频格式如表7所示。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。 SIS.0536 录音文件识任务提交数量达到限制。请稍后重试。 SIS

帮助中心 > 语音交互服务 SIS > API参考 > 附录
产品咨询类 - 语音交互服务 SIS

产品咨询类什么是语音交互服务支持哪些语言语音合成后输出的音频格式是什么是否支持离线使用语音合成后能否返回播放时长是否支持aac格式的语音文件转文字如何查看当前接口是否免费调用

 帮助中心 > 语音交互服务 SIS > 常见问题

总条数： 72

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

一句话识别Websocket接口 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

使用实时语音合成 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

示例音频 - 语音交互服务 SIS

示例音频 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

产品咨询类 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线