搜索_华为云

什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语

 帮助中心 > 语音交互服务 SIS > 产品介绍
调用语音交互的API显示auth failed - 语音交互服务 SIS

确保获取Token为24小时之内的Token。确保获取Token的参数嵌套是否正确。正确的嵌套应该如下列代码示例所示，错误的嵌套也能获取Token，但无法访问服务。使用AK/SK方式访问，检查AK和SK是否填写正确。检查“project_id”是否填写正确。“project_id”可参考获取项目ID。如果

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

SDK简介语音交互概述语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音

 帮助中心 > 语音交互服务 SIS > SDK参考
使用实时语音合成 - 语音交互服务 SIS

通过set方法可以设置具体参数，详见表 RttsRequest设置参数表3 RttsRequest设置参数方法名称是否必选参数类型描述 SetAudioFormat 否 String 设置语音格式，默认pcm。 SetAudioProperty 否 String 设置语音合成特

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
使用实时语音识别 - 语音交互服务 SIS

如chinese_8k_common，参见《API参考》中开始识别章节。通过set方法可以设置具体参数，详见表 RasrRequest设置参数表3 RasrRequest设置参数方法名称是否必选参数类型描述 SetPunc 否 String 表示是否在识别结果中添加标点，取值为yes

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
语音交互服务使用简介 - 语音交互服务 SIS

语音交互服务使用简介语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口

 帮助中心 > 语音交互服务 SIS > 快速入门
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
使用实时语音识别 - 语音交互服务 SIS

如chinese_8k_common，参见《API参考》中开始识别章节。通过set方法可以设置具体参数，详见表 RasrRequest设置参数表3 RasrRequest设置参数方法名称是否必选参数类型描述 SetPunc 否 String 表示是否在识别结果中添加标点，取值为yes

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
使用实时语音合成 - 语音交互服务 SIS

通过set方法可以设置具体参数，详见表 RttsRequest设置参数表3 RttsRequest设置参数方法名称是否必选参数类型描述 SetAudioFormat 否 String 设置语音格式，默认pcm。 SetAudioProperty 否 String 设置语音合成特

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
语音交互服务的区域如何选择 - 语音交互服务 SIS

语音交互服务的区域如何选择不同区域的资源之间内网不互通。为保证网络的连通性，降低网络时延、提高访问速度，请选择靠近您客户的区域，当前语音服务支持北京和上海区域，后续会陆续上线其他区域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。如果检查参数“property”是否与采样率一致，如“chinese_8k_common”，

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audio_format参数设置的语音格式为准。若audio_format的值设置为wav，则解码后输出为wav格式，如果设置为mp3，则解码后输出mp3格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
调用Java SDK实现一句话识别 - 语音交互服务 SIS

Demo中认证鉴权方式可选AK/SK认证或者Token认证，本示例中使用AK/SK认证。获取AK/SK。 AK/SK即访问秘钥，请登录“我的凭证”界面，选择“管理访问密钥 > 新增访问密钥”获取。 AK/SK认证鉴权，配置Java SDK中的AK/SK。根据获取的AK/SK，修改Demo工

 帮助中心 > 语音交互服务 SIS > 快速入门
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

使用实时语音识别时请确认是否分片发送音频，并在wss握手后发送start命令。报错data url is empty，时请参考配置OBS访问权限，设置OBS权限，并检查使用的URL是否正确。报错data base64 encode invalid，请检查语音转Base64后的字符串是否存在错误，如多空格、字符错误等。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
获取AK/SK - 语音交互服务 SIS
获取AK/SK - 语音交互服务 SIS

AK/SK生成步骤：登录管理控制台。单击右上角的用户名，在下拉列表中单击“我的凭证”。单击“访问密钥”。单击“新增访问密钥”。依据界面提示，获取并下载秘钥，请妥善保管。图2 获取访问秘钥父主题：附录

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
本地调用 - 语音交互服务 SIS
本地调用 - 语音交互服务 SIS

在PyCharm中新建一个项目，打开解压后的SDK包。修改代码中的认证信息，并填写待合成文本。表1 参数说明参数名称描述 ak、sk 登录访问密钥界面，选择“管理访问密钥 > 新增访问密钥”获取。访问密钥为credentials.csv文件，包含AK/SK信息。 region 部署区域，如：cn-north-4。具体请参考终端节点。

帮助中心 > 语音交互服务 SIS > 用户指南 > 调用API或SDK
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数名称参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应

总条数： 77

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是语音交互服务 - 语音交互服务 SIS

调用语音交互的API显示auth failed - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

使用实时语音合成 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

使用实时语音合成 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

获取AK/SK - 语音交互服务 SIS

本地调用 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线