搜索_华为云

功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

功能介绍实时语音识别实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文相关语义特征

 帮助中心 > 语音交互服务 SIS > 产品介绍
语音交互服务需要申请什么权限 - 语音交互服务 SIS

语音交互服务需要申请什么权限语音交互服务本身无权限限制，用户不需要额外添加任何权限，即可对语音交互服务执行操作。但是如下场景除外：当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
本地调用 - 语音交互服务 SIS
本地调用 - 语音交互服务 SIS

本地调用本章节以语音合成为例，介绍如何使用SIS Python SDK在本地进行开发。该SDK可以将用户输入的文字合成为音频。通过音色选择，自定义音量、语速，实现个性化音频的生成。前提条件注册华为账号并开通华为云，并完成实名认证，账号不能处于欠费、冻结、被注销等异常状态。

帮助中心 > 语音交互服务 SIS > 用户指南 > 调用API或SDK
身份认证与访问控制 - 语音交互服务 SIS

身份认证与访问控制身份认证用户访问SIS的方式有多种，包括SIS控制台、API、SDK，无论访问方式封装成何种形式，其本质都是通过SIS提供的API接口进行请求。 SIS的接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证调用请求。 AK

帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
修订记录 - 语音交互服务 SIS
修订记录 - 语音交互服务 SIS

修订记录发布日期修订说明 2023-09-27 新增： iOS SDK新增一句话识别、实时语音识别连续模式 2023-03-06 新增： CPP SDK支持Linux版本 2022-08-02 新增： Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP

帮助中心 > 语音交互服务 SIS > SDK参考
Websocket握手请求 - 语音交互服务 SIS

Websocket握手请求功能介绍本接口提供实时流式语音合成。用户每次建立连接，发送待合成文本，服务端将合成结果响应给用户。一次连接只能发送一次文本，如果有多段文本需要合成，需要多次建立连接。实时语音合成和语音合成均属于语音合成接口，采用完全相同的计费规则，两者价格梯度可互相叠加

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口
流式一句话 - 语音交互服务 SIS

流式一句话功能介绍流式一句话模式的语音长度限制为一分钟，适合于对话聊天等识别场景。该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，将直接丢弃

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口

 帮助中心 > 语音交互服务 SIS > API参考
调用Java SDK实现一句话识别 - 语音交互服务 SIS

调用Java SDK实现一句话识别语音交互服务软件开发工具包（SIS SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过

 帮助中心 > 语音交互服务 SIS > 快速入门
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

http接口功能介绍一句话识别接口，用于短语音的同步识别。一次性上传1min以内音频，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成功能介绍语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
websocket接口 - 语音交互服务 SIS

websocket接口功能介绍一句话识别websocket接口支持识别1min以内的音频，交互过程如图客户端和服务端交互流程所示，主要分为开始识别、发送音频数据，结束识别、断开连接四个步骤。 websocket接口同http接口一致按次计费，只要建立连接成功，发送音频，服务开始识别

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成前提条件确保已按照配置Java环境配置完毕。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化TtsCustomizationClient，其参数包括AuthInfo和SisConfig。表1 AuthInfo 参数名称是否必选

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
一句话识别Http接口 - 语音交互服务 SIS

一句话识别Http接口前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化AsrCustomizationClient，其参数包括

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
实时语音识别 - 语音交互服务 SIS

实时语音识别前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient，其参数包括AuthInfo、RasrListener

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件识别 - 语音交互服务 SIS

录音文件识别前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。请参考SDK（websocket

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK

总条数： 57

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

功能介绍 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

本地调用 - 语音交互服务 SIS

身份认证与访问控制 - 语音交互服务 SIS

修订记录 - 语音交互服务 SIS

Websocket握手请求 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线