搜索_华为云

语音交互服务需要申请什么权限 - 语音交互服务 SIS

当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object Storage Service，对象存储服务）桶中。考虑到数据的安全，语音交互服务无法直接获取到用户数据，需要用户授权录音文件引擎读取用户OBS

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
调用说明 - 语音交互服务 SIS
调用说明 - 语音交互服务 SIS

ocket API。调用所需示例音频参见示例音频。调用接口的时候，无需开通服务，可直接调用。此时请按照实际需要选择计费方式，计费是按照调用接口的次数或者时长来计算费用，具体计费价格参见语音交互价格计算器。支持两种计费方式：按需计费，默认计费方式为“按需计费”。折扣套餐包

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

如果设置为0，表示不检测“长时间静音”情况。取值范围：[0, 60000]的整数，单位为ms，默认为10000ms，即10s。 vad_tail 否 Integer 音频的结尾中的静音时间，正常情况下不应设成很小的值。如果检测语音结尾的静音时长大于等于此值时，在实时语音识别单句模式下将返回VO

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成的在线使用页面，用户无需编程即可使用服务功能。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
调用Java SDK实现一句话识别 - 语音交互服务 SIS

SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java SDK调用一句话识别服务的样例，帮助用户快速了解如何使用Java

帮助中心 > 语音交互服务 SIS > 快速入门
There was a bad response from the server报错 - 语音交互服务 SIS

from the server报错。表示无法正常连接到SIS服务。请先检查您的华为云账号是否已经进行了实名认证。如果您的网络环境异常也会引发该报错，请确保您的网络连接正常，可以访问SIS服务。如果使用的是局域网或内部网络，请确保可以正常访问公网。网络环境如果正常，请检查代码示

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
SDK（websocket） - 语音交互服务 SIS

语音交互SDK软件包获取请参见表下载SDK包。示例音频参见示例音频。当您使用过旧版本的Java SDK时，需要注意旧版本的SDK依赖的jar包与新版本SDK的jar包有无冲突。新版本SDK升级日志为log4j2，同时java-sdk-core升级到3.0.12版本。优先推荐使用新版SDK语音交互服务SD

帮助中心 > 语音交互服务 SIS > SDK参考
实时语音识别连续模式 - 语音交互服务 SIS

就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识别模式中，可能多次返回识别结果。如果送入的一段语音较长，甚至有可能在一次返回中包括了多段的识别结果。由于引入了静音检测，连续识别模式通常会比流式识别能具有更高的效率，因为对于静音段将不会进行特征提取和

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
websocket接口 - 语音交互服务 SIS

要实时反馈的情况下100ms，不需要实时反馈的情况下500ms。结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "结束识别"请求使用文本类型的数据帧(text message)发送，命令和参数以json字符串的形式提供。

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
calc ak sk signature fail:signature expired报错 - 语音交互服务 SIS

fail:signature expired报错。表示的是AK、SK凭证过期。请先检测您使用的是临时AK、SK，还是永久性AK、SK。临时安全凭证通过接口临时访问密钥AK/SK获取；永久安全凭证通过我的凭证界面控制台获取。如果使用的是永久性AK、SK出现此报错。请检查您的服务器时间和网络时间是否一致，时间同步后，可解决该报错。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
计费说明 - 语音交互服务 SIS
计费说明 - 语音交互服务 SIS

或时长。购买的套餐包在生效期内，扣费方式是先扣除已购买的套餐包内的额度后，超出部分以按需计费的方式进行结算。购买的套餐包到期后如果没有购买新的套餐包，系统会自动转为按需计费。变更配置 SIS默认使用按需计费。您也可以根据您的实际情况购买资源包，购买后对应区域的资源将自动转为

 帮助中心 > 语音交互服务 SIS > 产品介绍
如何查看当前接口是否免费调用 - 语音交互服务 SIS

套餐包购买时长为1年，可通过叠加套餐包累加API调用次数或时长。购买的套餐包在生效期内，扣费方式是先扣除已购买的套餐包内的额度后，超出部分以按需计费的方式进行结算。购买的套餐包到期后如果没有购买新的套餐包，系统会自动转为按需计费。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
什么是区域与可用区 - 语音交互服务 SIS

器下。资源的价格不同区域的资源价格可能有差异，请参见华为云服务价格详情。如何选择可用区是否将资源放在同一可用区内，主要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
SDK（新版） - 语音交互服务 SIS

ocket的方法调用的API。如需使用websocket接口，请前往SDK（websocket）。在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能，降低您使用SDK的难度，推荐使用。 SDK列表在开始使用之前，请确保您安装的是最新版本的SDK。使用

 帮助中心 > 语音交互服务 SIS > SDK参考
API概览 - 语音交互服务 SIS
API概览 - 语音交互服务 SIS

API概览 SIS服务提供了两种接口，包含REST（Representational State Transfer）API，支持您通过HTTPS请求调用，请参见表1。也包含WebSocket接口，支持Websocket协议，请参见表2。表1 REST API功能接口功能 API

帮助中心 > 语音交互服务 SIS > API参考
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

分别提供了“流式一句话”、“实时语音识别连续模式”、“实时语音识别单句模式”三种模式。三种模式的握手请求wss-URI不同，基于Websocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、python、c++等开发语言支持Websocket的对应软件

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
配置热词表（可选） - 语音交互服务 SIS

尽量避免配置单音节的英文单词，避免误召回，如：MAY/TEE等。自定义权重热词用于提升热词召回率，主要应用于以下场景。所配置的关键词与常见词发音一样，导致热词不能百分百生效。如雇工 vs 故宫。由于故宫更加常见，所以可能存在即使配置了雇工这个热词，也无法召回的情况。所配置的关键词含

 帮助中心 > 语音交互服务 SIS > 用户指南
身份认证与访问控制 - 语音交互服务 SIS

Key)加密调用请求。经过认证的请求总是需要包含一个签名值，该签名值以请求者的访问密钥（AK/SK）作为加密因子，结合请求体携带的特定信息计算而成。通过访问密钥（AK/SK）认证方式进行认证鉴权，即使用Access Key ID（AK）/Secret Access Key（SK）加密的方法来验证某

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

录音文件识别接口，用于转写不超过5小时的音频。由于录音文件转写需要较长的时间，因此转写是异步的。表4 语音合成接口说明接口类型说明语音合成/实时语音合成语音合成，依托先进的语音技术，使用深度学习算法，将文本转换为自然流畅的语音。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

一句话识别可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据，系统经过处理，生成语音对应的文字，支持的语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。产品优势高识别率基于深度学习技术，对特定领域场景的语音识别进行优化，识别率达到业界领先。

帮助中心 > 语音交互服务 SIS > 产品介绍

总条数： 57

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音交互服务需要申请什么权限 - 语音交互服务 SIS

调用说明 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

There was a bad response from the server报错 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

calc ak sk signature fail:signature expired报错 - 语音交互服务 SIS

计费说明 - 语音交互服务 SIS

如何查看当前接口是否免费调用 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

SDK（新版） - 语音交互服务 SIS

API概览 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

身份认证与访问控制 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线