搜索_华为云

与其他云服务的关系 - 语音交互服务 SIS

对象存储服务 SIS服务接口支持从对象存储服务（Object Storage Service，OBS）上采用临时授权和匿名公开授权的方式获取数据并进行处理。录音文件识别支持从OBS上采用授权的方式获取数据并进行处理。OBS更多信息请参见《对象存储服务产品介绍》。

帮助中心 > 语音交互服务 SIS > 产品介绍
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
准备数据 - 语音交互服务 SIS
准备数据 - 语音交互服务 SIS

准备数据数据要求受技术与成本多种因素制约，SIS服务存在一些约束限制。详情请参考产品介绍中的约束与限制章节。

帮助中心 > 语音交互服务 SIS > 用户指南
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
数据保护技术 - 语音交互服务 SIS

表1 SIS的数据保护手段和特性数据保护手段说明传输加密 SIS支持HTTPS、WebScoket传输协议，采用华为云官网标准网关，数据传输过程有全链路安全保障。数据存储华为云SIS承诺数据不落盘，用户的原始文本和音频结果数据均不作保留，识别返回后立即释放。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
实时语音合成 - 语音交互服务 SIS

响应参数 Python SDK响应结果为byte数组，保存合成音频数据。详见代码示例。调用失败处理方法请参见错误码。代码示例如下示例仅供参考，最新代码请前往SDK（websocket）章节获取并运行。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
实时语音识别工作流程 - 语音交互服务 SIS

当服务端超过20s没有收到客户的任何数据时，会返回error事件，并主动断开。图1 工作流程父主题：实时语音识别请求

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
流式一句话 - 语音交互服务 SIS

实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后，仅延迟很短的时间（也即等待处理最后一段语音数据以及获取最终结果的时间）即可返回最终识别结果。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音合成后能否返回播放时长 - 语音交互服务 SIS

若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
识别结果响应 - 语音交互服务 SIS

请参考表 result数据结构。表3 result数据结构参数名参数类型说明 text String 识别结果。 score Float 识别结果的置信度，取值范围：0~1。此值会在实时识别中不断刷新，直到返回最终结果。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
配置OBS访问权限 - 语音交互服务 SIS

EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服务使用成本，降低服务的响应时长，提升服务使用的体验。语音交互服务优先推荐使用同一region下OBS的音频链接作为传入音频的URL。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
什么是区域与可用区 - 语音交互服务 SIS

图1 区域和可用区目前，华为云已在全球多个地域开放云服务，您可以根据需求选择适合自己的区域和可用区。如何选择区域？选择区域时，您需要考虑以下几个因素：地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
语音交互服务需要申请什么权限 - 语音交互服务 SIS

考虑到数据的安全，语音交互服务无法直接获取到用户数据，需要用户授权录音文件引擎读取用户OBS桶权限，只有主账号或者有Security Administrator权限的子账号才可以授权。主账号：即在使用语音交互服务前注册的账号，该账号具有管理员权限，可执行所有操作。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
实时语音识别连续模式 - 语音交互服务 SIS

语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，将直接丢弃。如果检测到一段语音的结束点，就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识别模式中，可能多次返回识别结果。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
SIS.0304报错 - 语音交互服务 SIS
SIS.0304报错 - 语音交互服务 SIS

超过20s没有发送数据同时也没有断开连接，就会报该错误。在使用完毕后一定要记得断开与服务端连接。父主题：错误码类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。父主题：权限类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

true：表示取消识别，也即丢弃识别中和未识别的语音数据并结束，不返回剩余的识别结果。 false：表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。默认是false。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求

总条数： 119

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

与其他云服务的关系 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

准备数据 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

SIS.0304报错 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线