搜索_华为云

什么是语音交互服务 - 语音交互服务 SIS

通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
什么是语音交互服务 - 语音交互服务 SIS

别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。免费体验一句话识别和语音合成免费体验请进入链接：https://www.huaweicloud

帮助中心 > 语音交互服务 SIS > 产品介绍
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

将视频直播或现场直播中的音频实时转为字幕，为观众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。即时文本录入手机App上实时录音并即时提供转写的文本，例如语音输入法等。人机交互

 帮助中心 > 语音交互服务 SIS > 产品介绍
功能体验与试用 - 语音交互服务 SIS

功能体验与试用语音交互服务（Speech Interaction Service，SIS）支持语音识别、语音合成功能。适用语音客服质检、会议记录、语音短消息、有声读物、电话回访等场景。在使用服务前，请先使用SIS体验中心体验服务功能。该方式无需编程，只需在网页端上传文字或音频，即可体验合成效果。

帮助中心 > 语音交互服务 SIS > 用户指南
录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > 语音交互服务 SIS > API参考
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 SDK概述优先推荐使用新版SDK语音交互服务SDK，该SDK基于统一规范开发，支持Java/Python/C++/

帮助中心 > 语音交互服务 SIS > SDK参考
语音交互服务使用简介 - 语音交互服务 SIS

音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。调用API接口需要具备一定的编程开发能力，返回的结果为JSON格式，用户需要通过编程来处理识别结果。

帮助中心 > 语音交互服务 SIS > 快速入门
提交录音文件识别任务 - 语音交互服务 SIS

east-3，强烈推荐使用） chinese_8k_common（中文普通话语音识别） chinese_16k_conversation（会议场景的中文普通话语音识别） sichuan_8k_common（四川话识别，区域支持cn-north-4，cn-east-3） chine

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。语音交互（实时语音识别、一句话识别、录音文件识别、语音合成）服务所提供的API为自研API。表1

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
权限类 - 语音交互服务 SIS
权限类 - 语音交互服务 SIS

权限类语音交互服务需要申请什么权限如何通过主账号创建一个子账号语音识别是强制绑定使用OBS进行录音文件存储吗

 帮助中心 > 语音交互服务 SIS > 常见问题
部署类 - 语音交互服务 SIS
部署类 - 语音交互服务 SIS

部署类语音交互服务是否支持私有化部署

 帮助中心 > 语音交互服务 SIS > 常见问题
获取录音文件识别结果 - 语音交互服务 SIS

电话质检等场景。对于16k单声道音频，支持多个说话人，取值范围是（speaker1 ~ speaker10），最多支持10个说话人，可用于会议场景。 emotion 否 String 情绪类型，目前仅支持NORMAL（正常），ANGRY（愤怒），UNKNOWN（未知）。在识别配置中emotion为true时存在。

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

理。 chinese_16k_court 支持采样率为16k的庭审会议语音识别。区域仅支持cn-north-4，不支持need_word_info参数。 chinese_16k_it 支持采样率为16k的IT会议语音识别。区域仅支持cn-north-4。 chinese_8k_common

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
安全 - 语音交互服务 SIS
安全 - 语音交互服务 SIS

安全责任共担身份认证与访问控制数据保护技术服务韧性监控安全风险

 帮助中心 > 语音交互服务 SIS > 产品介绍
SDK使用类 - 语音交互服务 SIS
SDK使用类 - 语音交互服务 SIS

SDK使用类 Java SDK是否支持使用Maven导入 SDK支持哪些语言

 帮助中心 > 语音交互服务 SIS > 常见问题
企业项目管理 - 语音交互服务 SIS

企业项目管理应用场景简介创建企业项目企业项目财务管理

 帮助中心 > 语音交互服务 SIS > 用户指南
附录 - 语音交互服务 SIS
附录 - 语音交互服务 SIS

附录示例音频

 帮助中心 > 语音交互服务 SIS > SDK参考
API使用类 - 语音交互服务 SIS
API使用类 - 语音交互服务 SIS

API使用类如何查看接口调用量为什么WebSocket一直连接不成功为什么会出现识别结果非常差的情况如何使用Websocket调用实时语音识别有哪些途径可以使用语音交互的API 返回状态正常，但识别结果为空 Token消息体中user name，domain name和project

帮助中心 > 语音交互服务 SIS > 常见问题
调用API或SDK - 语音交互服务 SIS

调用API或SDK 在线调试本地调用

 帮助中心 > 语音交互服务 SIS > 用户指南

总条数： 65

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

功能体验与试用 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

权限类 - 语音交互服务 SIS

部署类 - 语音交互服务 SIS

获取录音文件识别结果 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

安全 - 语音交互服务 SIS

SDK使用类 - 语音交互服务 SIS

企业项目管理 - 语音交互服务 SIS

附录 - 语音交互服务 SIS

API使用类 - 语音交互服务 SIS

调用API或SDK - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线