搜索_华为云

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息 - 语音交互服务 SIS

账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息问题描述账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息？解决方案如果是同一个区域的服务，存在套餐会先从套餐计费，超出套餐的部分才会按照按需计费。请确认上述套餐和欠费服务否属于不同服务或者不同区域的。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

long, and the audio will not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
为什么WebSocket一直连接不成功 - 语音交互服务 SIS

为什么WebSocket一直连接不成功问题现象由于在没连接成功前无法返回服务端任何信息，因此连接不成功需要多方面定位原因。解决方案 1. 检查网络是否可用，能否连接互联网，检查url输入是否正确。 2. 检查Token是否可用，检查Token的方法参考调用语音交互的API显示auth

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

为什么服务端返回OBS链接不可用（data url is unreachable）问题现象服务后台无法访问用户提供的音频的OBS链接。即无法获取用户需要识别的音频文件。解决方案检查用户是否授权服务访问OBS。检查存放音频的OBS的Region和服务的Region是否为同一区域，只有同一区域的OBS才能正常访问。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
如何使用Websocket调用实时语音识别 - 语音交互服务 SIS

如何使用Websocket调用实时语音识别解决方案 1. 下载Java SDK 或 Python SDK，参考《SDK参考》中获取SDK章节。 2. 配置SDK环境，参考《SDK参考》中配置Java环境。 3. 使用SDK里的demo进行调用。参考Java SDK和Python

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成的base64编码如何使用 - 语音交互服务 SIS

语音合成的base64编码如何使用问题现象用户在使用语音合成获取响应体的base64编码，不了解应该如何进一步使用。解决方案 1. 建议用户使用Java或Python SDK，可参考SDK简介。 2. 使用html网页播放，新建一个html文件，如下填写内容，即可在浏览器播放。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout）问题现象超时通常是由于网络不通造成的，需要对网络环境和代码进行具体分析。解决方案检查网络是否正常。确保网络正常连接互联网，正常访问华为云官网，成功获取Token等。如果使用代理，需要保证代理可用性。检查url是否存在错误。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
实时语音识别连续模式 - 语音交互服务 SIS

连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，将直接丢弃。如果检测到一段语音的结束点，就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识别模式中，可能多次

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
调用语音交互的API显示auth failed - 语音交互服务 SIS

调用语音交互的API显示auth failed 问题现象校验失败服务端通常是使用不正确的Token进行访问，可能产生的原因有多种。解决方案检查用户账号是否正常。当用户账号存在未实名认证、未充值或者属于冻结状态。您可登录账号，在用户检查是否实名认证，是否有余额（以上信息在用户Console均可以查到）。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

Boolen 是否取消返回识别结果。 true：表示取消识别，也即丢弃识别中和未识别的语音数据并结束，不返回剩余的识别结果。 false：表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。默认是false。示例 { "command": "END", "cancel":

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
识别结果响应 - 语音交互服务 SIS

服务内部的令牌，可用于在日志中追溯具体流程。 segments Array of objects 多句结果。请参考表 segment 数据结构。表2 segment 数据结构参数名参数类型说明 start_time Integer 相对时间戳，表示一句的起始，单位为ms。 end_time

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音合成 - 语音交互服务 SIS

on_response(self, data): """ 回调返回的音频合成数据，byte数组格式 :param data byte数组，合成的音频数据 :return: - """ print('receive

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
基本概念 - 语音交互服务 SIS
基本概念 - 语音交互服务 SIS

用户注册华为云时的账号，账号对其所拥有的资源及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
语音合成结果响应 - 语音交互服务 SIS

语音合成结果响应音频流数据时间戳数据父主题：实时语音合成响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
语音交互服务需要申请什么权限 - 语音交互服务 SIS

Administrator的权限。因为录音文件保存在用户的OBS（Object Storage Service，对象存储服务）桶中。考虑到数据的安全，语音交互服务无法直接获取到用户数据，需要用户授权录音文件引擎读取用户OBS桶权限，只有主账号或者有Security Administrator权限的子账号才可以授权。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类

总条数： 117

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

为什么WebSocket一直连接不成功 - 语音交互服务 SIS

为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

如何使用Websocket调用实时语音识别 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

语音合成的base64编码如何使用 - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout） - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

调用语音交互的API显示auth failed - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

基本概念 - 语音交互服务 SIS

语音合成结果响应 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线