搜索_华为云

概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

语音合成/实时语音合成语音合成，依托先进的语音技术，使用深度学习算法，将文本转换为自然流畅的语音。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等，可自定义音频格式，为企业和个人提供个性化的发音服务。父主题：使用前必读

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
基本概念 - 语音交互服务 SIS
基本概念 - 语音交互服务 SIS

信息。区域（Region）从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云服务的Region；专属Regio

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
调用Java SDK实现一句话识别 - 语音交互服务 SIS

调用Java SDK实现一句话识别语音交互服务软件开发工具包（SIS SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java

帮助中心 > 语音交互服务 SIS > 快速入门
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 SDK概述优先推荐使用新版SDK语音交

 帮助中心 > 语音交互服务 SIS > SDK参考
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

TtsCustomRequest 参数名称是否必选参数类型描述 text 是 String 待合成的文本。 audio_format 否 String 待合成的音频格式，可选mp3，wav等，默认wav。具体信息请参见《API参考》语音合成章节。 pitch 否 Integer 音高，[-500,500]

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
数据保护技术 - 语音交互服务 SIS

述数据所有权及控制权，您应自行对上述数据来源和获取的合法性负责，华为云受托处理您的数据，以实现本服务功能或目的：（1）将语音音频数据识别转换成文本。（2）将文本数据合成语音。您的上述数据将在中华人民共和国境内处理，处理完后立即删除，华为云不会保存以上数据。 SIS通过多种数

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
有哪些途径可以使用语音交互的API - 语音交互服务 SIS

有哪些途径可以使用语音交互的API 共有三种方式可以基于已构建好的请求消息发起请求。 cURL cURL是一个命令行工具，用来执行各种URL操作和信息传输。cURL充当的是HTTP客户端，可以发送HTTP请求给服务端，并接收响应消息。cURL适用于接口调试。关于cURL详细信息请参见https://curl

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
开始语音合成请求 - 语音交互服务 SIS

Object 否配置信息。请参考表2。表2 config数据结构名称参数类型是否必选说明 audio_format String 否语音格式头：pcm、alaw、ulaw、mp3。默认：pcm sample_rate String 否采样率：16000、8000赫兹。默认：8000

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
热词管理 - 语音交互服务 SIS
热词管理 - 语音交互服务 SIS

热词长度上限32字节。 description 否 String 热词表描述，长度不超过255字节。响应参数创建热词响应参数为Json格式，详见表4。调用失败处理方法请参见错误码。表4 创建热词响应参数名称是否必选参数类型描述 vocabulary_id 是 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

0535 录音文件识请求的文件类型不支持。确保设置的audio_format格式的值是合法。录音文件识别支持的音频格式如表7所示。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。 SIS.0536 录音文件识任务提交数量达到限制。请稍后重试。 SIS

帮助中心 > 语音交互服务 SIS > API参考 > 附录
提交录音文件识别任务 - 语音交互服务 SIS

表7 audio_format取值范围 audio_format取值描述 auto 默认格式，系统自动判断，支持的音视频格式如下：WAV（内部支持pcm/ulaw/alaw/adpcm编码格式）、AMR、FLAC、M4A、MP3、OGG、WEBM、AAC、AC3、MOV、WMA、

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
示例音频 - 语音交互服务 SIS
示例音频 - 语音交互服务 SIS

测试音频如表示例音频所示，音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k，位宽为16bit。表1 示例音频音频格式下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud.com/16k16bit

帮助中心 > 语音交互服务 SIS > SDK参考 > 附录
示例音频 - 语音交互服务 SIS
示例音频 - 语音交互服务 SIS

测试音频如表示例音频所示，音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k，位宽为16bit。表1 示例音频音频格式下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud.com/16k16bit

帮助中心 > 语音交互服务 SIS > API参考 > 附录
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

获取Websocket握手请求wss-URI请参见Websocket握手请求。获取实时语音识别请求消息格式信息请参见实时语音识别请求。获取实时语音识别响应消息格式请参见实时语音识别响应。客户端通过Websocket协议访问实时流转写接口时，连接时长不能超过5小时。超过5

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
一句话识别 - 语音交互服务 SIS

一句话识别前提条件确保已经按照配置好iOS开发环境。已经保存好1分钟内音频文件，建议使用16k16bit进行录音并保存为wav格式。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SASRClient，参数为AuthInfo，详见表1。

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
录音文件识别极速版 - 语音交互服务 SIS

当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。支持从华为云对象存储服务（OBS）下载音频，需要用户提供OBS桶名和对象键值。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
最新动态 - 语音交互服务 SIS
最新动态 - 语音交互服务 SIS

帮助中心 > 语音交互服务 SIS > 最新动态
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
公共请求参数 - 语音交互服务 SIS

请求body长度，单位为Byte。 3495 Upgrade 发送WebSocket握手请求时，包含该头域。 upgrade是HTTP1.1中用于定义转换协议的header域。 Websocket Connection 发送WebSocket握手请求时，包含该头域。带有Upgrade头的HTTP1

帮助中心 > 语音交互服务 SIS > API参考 > 附录
录音文件识别 - 语音交互服务 SIS

region，如cn-north-4 """ todo 请正确填写音频格式和模型属性字符串 1. 音频格式一定要相匹配. 例如wav音频，格式是auto。具体参考api文档。例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK

总条数： 78

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概述 - 语音交互服务 SIS

基本概念 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

有哪些途径可以使用语音交互的API - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

热词管理 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

示例音频 - 语音交互服务 SIS

示例音频 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

最新动态 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

公共请求参数 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线