搜索_华为云

概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

语音合成/实时语音合成语音合成，依托先进的语音技术，使用深度学习算法，将文本转换为自然流畅的语音。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等，可自定义音频格式，为企业和个人提供个性化的发音服务。父主题：使用前必读

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
什么是语音交互服务 - 语音交互服务 SIS

Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API（Application Programming Interface，应用程序编程接口）获取语音交互结果。例如用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
查看套餐用量明细、账单明细 - 语音交互服务 SIS

登录SIS服务控制台。单击左侧导航栏“套餐包 > 套餐包管理”，进入“费用中心 > 资源包”页面查看套餐包的用量，在“费用中心 > 账单管理”中查看账单明细。资源包列会展示全部云服务，请按照订购的资源包名称进行搜索。图1 资源包列表父主题：计费类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
识别结果响应 - 语音交互服务 SIS

String 服务内部的令牌，可用于在日志中追溯具体流程。 segments Array of objects 多句结果。请参考表 segment 数据结构。表2 segment 数据结构参数名参数类型说明 start_time Integer 相对时间戳，表示一句的起始，单位为ms。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
语音交互服务需要申请什么权限 - 语音交互服务 SIS

当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object Storage Service，对象存储服务）桶中。考虑到数据的安全，语音交互服务无法直接获取到用户数据，需要用户授权录音文件引擎读取用户OBS

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
获取AK/SK - 语音交互服务 SIS
获取AK/SK - 语音交互服务 SIS

credential.csv文件内容 AK/SK生成步骤：登录管理控制台。单击右上角的用户名，在下拉列表中单击“我的凭证”。单击“访问密钥”。单击“新增访问密钥”。依据界面提示，获取并下载秘钥，请妥善保管。图2 获取访问秘钥父主题：附录

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音

 帮助中心 > 语音交互服务 SIS > SDK参考
一句话识别Http接口 - 语音交互服务 SIS

import os # 鉴权参数 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件极速版 - 语音交互服务 SIS

import os # 鉴权参数 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_S

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别极速版接口 - 语音交互服务 SIS

wav。如果上传至OBS桶中的文件或OBS路径为中文，obs_object_key的值需要采用中文形式。 obs_object_key 是 String 表示OBS对象桶中的对象的键值，长度小于1024个字符，需要进行urlencode编码。 OBS桶区域需要与接口的地址区域一致。示例：

帮助中心 > 语音交互服务 SIS > API参考
创建热词表 - 语音交互服务 SIS

在一句话识别、录音文件识别、实时语音识别服务中，如果在您的业务领域有一些特有的词，默认识别效果差的时候可以考虑使用热词管理功能，将这些词添加到词表，改善识别效果。热词可以是姓名、公司名、某个领域的专有名词，如人名"王晓茗”（通常会识别为"王小明”）、运输域的“高栏”等。热词不建议太长，也不

 帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
配置CPP环境（Linux） - 语音交互服务 SIS

本SDK所依赖的三方库包含 - openssl - jsoncpp - websocketpp - glog - gflags - boost 依赖库均以源码形式存放在SDK根目录，SDK默认是开启所有依赖库安装，即运行cmake命令时，SDK会默认安装这些依赖库。如果您在系统中已安装

 帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

invalid报错，请使用存放在OBS的音频文件路径，并确保OBS的region要和请求服务的region保持一致。 SIS.0535 录音文件识请求的文件类型不支持。确保设置的audio_format格式的值是合法。录音文件识别支持的音频格式如表7所示。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
数据保护技术 - 语音交互服务 SIS

在使用语音交互服务过程中委托我们处理的语音音频和文本等数据，您完全拥有上述数据所有权及控制权，您应自行对上述数据来源和获取的合法性负责，华为云受托处理您的数据，以实现本服务功能或目的：（1）将语音音频数据识别转换成文本。（2）将文本数据合成语音。您的上述数据将在中华人民共和国境内

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
获取项目ID - 语音交互服务 SIS
获取项目ID - 语音交互服务 SIS

cts”，其中{Endpoint}为IAM的终端节点。接口的认证鉴权请参见认证鉴权。响应示例如下，例如，语音交互服务部署的区域为“cn-north-4”，响应消息体中查找“name”为“cn-north-4”，其中projects下的“id”即为项目ID。 { "projects":

帮助中心 > 语音交互服务 SIS > API参考 > 附录
一句话识别Websocket接口 - 语音交互服务 SIS

// 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； // 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
返回结果 - 语音交互服务 SIS
返回结果 - 语音交互服务 SIS

返回结果状态码请求发送以后，您会收到响应，包含状态码、响应消息头和消息体。状态码是一组从1xx到5xx的数字代码，状态码表示了请求响应的状态，完整的状态码列表请参见状态码。对于SIS服务接口，如果调用后返回状态码为“200”，则表示请求成功。响应消息头对应请求消息头，

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
实时语音识别 - 语音交互服务 SIS

import os # 鉴权参数 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别多久可以返回结果 - 语音交互服务 SIS

录音文件识别多久可以返回结果音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。表1 音频转写时长参考表音频时长参考返回时间

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类

总条数： 168

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概述 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

查看套餐用量明细、账单明细 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

识别结果响应 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

获取AK/SK - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

创建热词表 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

获取项目ID - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

返回结果 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

录音文件识别多久可以返回结果 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线