搜索_华为云

发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
准备数据 - 语音交互服务 SIS
准备数据 - 语音交互服务 SIS

准备数据数据要求受技术与成本多种因素制约，SIS服务存在一些约束限制。详情请参考产品介绍中的约束与限制章节。

帮助中心 > 语音交互服务 SIS > 用户指南
数据保护技术 - 语音交互服务 SIS

数据保护技术在使用语音交互服务过程中委托我们处理的语音音频和文本等数据，您完全拥有上述数据所有权及控制权，您应自行对上述数据来源和获取的合法性负责，华为云受托处理您的数据，以实现本服务功能或目的：（1）将语音音频数据识别转换成文本。（2）将文本数据合成语音。您的上述数据将

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

inese_xiaoyan_common。具体信息请参见《API参考》中语音合成章节。 saved 否 Boolean 是否选择合成的音频数据保存到本地，默认不保存。 saved_path 否 String 选择保存到本地的路径，需要具体到音频文件，如D:/test.wav。响应参数

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
什么是区域与可用区 - 语音交互服务 SIS

什么是区域与可用区什么是区域、可用区我们用区域和可用区来描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通

 帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
实时语音合成 - 语音交互服务 SIS

on_response(self, data): """ 回调返回的音频合成数据，byte数组格式 :param data byte数组，合成的音频数据 :return: - """ print('receive

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
提交录音文件识别任务 - 语音交互服务 SIS

16k16bit裸音频录音数据。 pcm8k16bit 8k16bit裸音频录音数据。 ulaw16k8bit 16k8bit ulaw 裸音频录音数据。 ulaw8k8bit 8k8bit ulaw 裸音频录音数据。 alaw16k8bit 16k8bit alaw 裸音频录音数据。 alaw8k8bit

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
流式一句话 - 语音交互服务 SIS

果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后，仅延迟很短的时间（也即等待处理最后一段语音数据以及获取最终结果的时间）即可返回最终识别结果。这种流式输入方式能缩

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
一句话识别 - 语音交互服务 SIS

projectId 是 String 项目ID，同region一一对应，参考获取项目ID。请求参数请求类为SASRConfig和语音数据data，详见表2。表2 SASRConfig 参数名称是否必选参数类型描述 config 是 Config object 配置信息。

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
与其他云服务的关系 - 语音交互服务 SIS

和鉴权功能。对象存储服务 SIS服务接口支持从对象存储服务（Object Storage Service，OBS）上采用临时授权和匿名公开授权的方式获取数据并进行处理。录音文件识别支持从OBS上采用授权的方式获取数据并进行处理。OBS更多信息请参见《对象存储服务产品介绍》。

帮助中心 > 语音交互服务 SIS > 产品介绍
配置OBS访问权限 - 语音交互服务 SIS

OBS全称Object Storage Service（对象存储服务），提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服务使用成本，降低服务的响应时长，提升服

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
语音交互服务需要申请什么权限 - 语音交互服务 SIS

Administrator的权限。因为录音文件保存在用户的OBS（Object Storage Service，对象存储服务）桶中。考虑到数据的安全，语音交互服务无法直接获取到用户数据，需要用户授权录音文件引擎读取用户OBS桶权限，只有主账号或者有Security Administrator权限的子账号才可以授权。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
基本概念 - 语音交互服务 SIS
基本概念 - 语音交互服务 SIS

可用区（AZ，Availability Zone）一个AZ是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。项目华为云的区域默认对应一个项目，这个项目由系统预置，用

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
身份认证与访问控制 - 语音交互服务 SIS

IAM权限是作用于云资源的，IAM权限定义了允许和拒绝的访问操作，以此实现云资源权限访问控制。管理员创建IAM用户后，需要将用户加入到一个用户组中，IAM可以对这个组授予SIS所需的权限，组内用户自动继承用户组的所有权限。委托授权如果用户想使用存储在对象存储服务（OBS）上的数据，他可以委托授权SIS服务访问对象存储服务。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全

总条数： 71

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发送音频数据 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

准备数据 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

实时语音合成 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

与其他云服务的关系 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

基本概念 - 语音交互服务 SIS

身份认证与访问控制 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线