搜索_华为云

什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API（Application Programming Interface，应用程序编程接口）获取语音交互结果。例如用户通过语音识别功能，

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
开始语音合成请求 - 语音交互服务 SIS

语音格式头：pcm、alaw、ulaw、mp3。默认：pcm sample_rate String 否采样率：16000、8000赫兹。默认：8000 property String 否可参考表3和表4。默认：chinese_xiaoyan_common 实时语音合成和语音合成属于同一种资源，按

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
实时语音识别连续模式 - 语音交互服务 SIS

式识别能具有更高的效率，因为对于静音段将不会进行特征提取和解码操作，因而能更有效地利用CPU。而流式识别通常和客户端的端点检测功能相结合，只将检测到的有效语音段上传到服务器进行识别。 wss-URI wss-URI格式 wss /v1/{project_id}/rasr/continue-stream

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别 - 语音交互服务 SIS

支持“华北-北京四”、“华东-上海一”区域。当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。音频采样率8KHz或

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
流式一句话 - 语音交互服务 SIS

Token。 Enterprise-Project-Id 否 String 企业项目ID。SIS支持通过企业项目管理（EPS）对不同用户组和用户的资源使用，进行分账。获取方法：进入“企业项目管理”页面，单击企业项目名称，在企业项目详情页获取Enterprise-Project-Id（企业项目ID）。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
热词管理 - 语音交互服务 SIS
热词管理 - 语音交互服务 SIS

终端节点，一般使用默认即可。 sis_config 否 Object 详见表2。表2 SisConfig 参数名称是否必选参数类型描述 connect_timeout 否 String 连接超时，默认10，单位s。 read_timeout 否 String 读取超时，默认10，单位s。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成功能介绍语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
实时语音识别连续模式 - 语音交互服务 SIS

addPunc 否 String 表示是否在识别结果中添加标点，取值为yes 、 no，默认no。 digitNorm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。 vocabularyId 否 String 热词表id，不使用则不填写。

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

待合成的音频格式，可选mp3，wav等，默认wav。具体信息请参见《API参考》中语音合成章节。 pitch 否 Integer 音高，[-500,500] ，默认是0。 speed 否 Integer 语速，[-500,500] ，默认是0。 volume 否 Integer 音量，[0,100]，默认是50。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

功能介绍实时语音识别实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文

 帮助中心 > 语音交互服务 SIS > 产品介绍
实时语音合成 - 语音交互服务 SIS

语音格式头：pcm、alaw、ulaw。默认：pcm pitch 否 Integer 音高，[-500,500] ，默认是0。 speed 否 Integer 语速，[-500,500] ，默认是0。 volume 否 Integer 音量，[0,100]，默认是50。 sample_rate

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
实时语音识别 - 语音交互服务 SIS

String 终端节点，一般使用默认即可。表2 SisConfig 参数名称是否必选参数类型描述 connect_timeout 否 Integer 连接超时，默认10，单位s。 read_timeout 否 Integer 读取超时，默认10，单位s。 connect_lost_timeout

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。一句话识别，录音文件识别支持的终端节点：

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
一句话识别Http接口 - 语音交互服务 SIS

终端节点，具体请参考地区和终端节点。一般使用默认即可。表2 SisConfig 参数名称是否必选参数类型描述 connectionTimeout 否 Integer 连接超时，默认10000，单位ms。 readTimeout 否 Integer 读取超时，默认10000，单位ms。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件极速版 - 语音交互服务 SIS

终端节点，参考地区和终端节点。一般使用默认即可。表2 SisConfig 参数名称是否必选参数类型描述 connectionTimeout 否 Integer 连接超时，默认10000，单位ms。 readTimeout 否 Integer 读取超时，默认10000，单位ms。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
一句话识别Websocket接口 - 语音交互服务 SIS

String 终端节点，一般使用默认即可。表2 SisConfig 参数名称是否必选参数类型描述 connect_timeout 否 Integer 连接超时，默认10，单位s。 read_timeout 否 Integer 读取超时，默认10，单位s。 connect_lost_timeout

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
SDK（websocket） - 语音交互服务 SIS

k-sis-1.8.3.zip Python https://sis-sdk-repository.obs.cn-north-1.myhuaweicloud.com/python/huaweicloud-python-sdk-sis-1.8.3.zip iOS(Swift) ht

帮助中心 > 语音交互服务 SIS > SDK参考
与其他云服务的关系 - 语音交互服务 SIS

Management，简称IAM）服务，IAM为语音交互服务提供了用户认证和鉴权功能。对象存储服务 SIS服务接口支持从对象存储服务（Object Storage Service，OBS）上采用临时授权和匿名公开授权的方式获取数据并进行处理。录音文件识别支持从OBS上采用授权的

 帮助中心 > 语音交互服务 SIS > 产品介绍
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。表3 property取值范围 property取值说明 chinese_8k_general 支持采样率为8k的中文普通话语音识别，采用新一代端到端识别算法，识别准确率更高。区域支持cn-east-3和cn-north-4（强烈推荐使用）。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
录音文件识别极速版 - 语音交互服务 SIS

录音文件识别极速版支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制

总条数： 100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是语音交互服务 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

热词管理 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

与其他云服务的关系 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线