搜索_华为云

时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

and the audio will not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
录音文件识别多久可以返回结果 - 语音交互服务 SIS

录音文件识别多久可以返回结果音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。表1 音频转写时长参考表音频时长参考返回时间小于10分钟小于2分钟

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
APIG.0201报错 - 语音交互服务 SIS

使用Postman等工具直接调用服务，查看是否成功，如果调用成功表示服务接口没有问题，请执行如下步骤1和步骤2进行检查：请检查原调用请求是否过于频繁，如果是并发过大，可以通过重试机制解决，在代码里检查返回值，碰到这个并发错误可以延时一小段时间（如2-5s）重试请求；也可以后端检查上一个请求结果，上一个请求返回之后再发送下一个请求，避免请求过于频繁。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
示例音频 - 语音交互服务 SIS
示例音频 - 语音交互服务 SIS

示例音频测试音频如表示例音频所示，音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k，位宽为16bit。表1 示例音频音频格式下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud

帮助中心 > 语音交互服务 SIS > SDK参考 > 附录
示例音频 - 语音交互服务 SIS
示例音频 - 语音交互服务 SIS

示例音频测试音频如表示例音频所示，音频文件标题表示采样率和位宽。如8k16bit.pcm表示音频采样率为8k，位宽为16bit。表1 示例音频音频格式下载链接 mp3 https://sis-sample-audio.obs.cn-north-1.myhuaweicloud

帮助中心 > 语音交互服务 SIS > API参考 > 附录
配置Java环境 - 语音交互服务 SIS

配置环境在使用语音交互SDK时，需要准备的环境请参见表开发环境。目前Java SDK不支持在android中使用。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。 JDK Java开发环境的基本配置。版本要求：强烈推荐使用1.8版本。

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
调用Java SDK实现一句话识别 - 语音交互服务 SIS

SDK实现一句话识别语音交互服务软件开发工具包（SIS SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java

帮助中心 > 语音交互服务 SIS > 快速入门
提交录音文件识别任务 - 语音交互服务 SIS

音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。表1 音频转写时长参考表音频时长参考返回时间小于10分钟小于2分钟

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式前提条件确保已经按照配置好iOS开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RASRClient，参数为AuthInfo和RASRConfig。表1 AuthInfo 参数名称是否必选参数类型描述

 帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
配置Android 环境 - 语音交互服务 SIS

配置Android 环境配置环境。在使用语音交互SDK时，需要提前配置好android系统的开发环境，如表1所示。表1 配置环境准备项准备项说明 JDK Java开发环境的基础配置。版本要求:推荐使用1.8版本。 Gradle 在Gradle官网上下载好之后，配置环境变量即可。推荐使用Gradle7

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
实时语音识别连续模式 - 语音交互服务 SIS

vadHead 否 Integer 头部最大静音时间，[0, 60000]，默认10000ms。 vadTail 否 Integer 尾部最大静音时间，[0, 3000]，默认500ms。 maxSeconds 否 Integer 音频最长持续时间， [1, 60]，默认30s。 intermediateResult

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
语音合成(webSocket版) - 语音交互服务 SIS

确保已经按照配置好Android开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RttsClient，其中参数包含AuthInfo和SisHttpConfig和RttsResponseListener。其中AuthInfo和SisHttpConfig的参数如表1所示。

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
SIS.0304报错 - 语音交互服务 SIS
SIS.0304报错 - 语音交互服务 SIS

SIS.0304报错问题现象客户端长时间没有发送语音，服务端超过20s没有收到语音，就会报这个错误。解决方案 1. 检查代码是否存在发送音频后睡眠过多时间。 2. 检查是否发送end请求，是否关闭客户端。超过20s没有发送数据同时也没有断开连接，就会报该错误。在使用完毕后一定要记得断开与服务端连接。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
流式一句话 - 语音交互服务 SIS

所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后，仅延迟很短的时间（也即等待处理最后一段语音数据以及获取最终结果的时间）即可返回最终识别结果。这种流式输入方式能缩短整体上获得最终结果的时间，极大地提升用户体验。 wss-URI wss-URI格式 wss /v1/{

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
一句话识别(http版) - 语音交互服务 SIS

endpoint是华为云各服务应用区域和各服务的终端节点，详情请查看地区和终端节点。请求参数请求类为RecognizeShortAudioRequest，该类的body参数为PostShortAudioReq。 PostShortAudioReq的包含data,和config两个参数，其

 帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

三种模式的握手请求wss-URI不同，基于Websocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、python、c++等开发语言支持Websocket的对应软件包或库接口，与实时语音识别引擎握手连接，并发送语音数据和接收转写结果，最后关闭Websocket连接。获取Websocket

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

功能介绍实时语音识别实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文

 帮助中心 > 语音交互服务 SIS > 产品介绍
一句话识别(websocket版) - 语音交互服务 SIS

needWordInfo 否 String 表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。建立连接 sasrWsClient.connect(); 发送开始识别指令和配置信息 sasrWsClient.sendStart(getStartRequest());

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
一句话识别 - 语音交互服务 SIS

} //认证用的AK和SK硬编码在代码中或明文存储都有很大安全风险，建议在配置文件或环境变量中密文存放，使用时解密，确保安全。 //本示例以AK和SK保存在环境变量中来实现身份验证为例，运行本示例请先在本地环

 帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK

总条数： 68

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

时间戳数据 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

录音文件识别多久可以返回结果 - 语音交互服务 SIS

APIG.0201报错 - 语音交互服务 SIS

示例音频 - 语音交互服务 SIS

示例音频 - 语音交互服务 SIS

配置Java环境 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

配置Android 环境 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

语音合成(webSocket版) - 语音交互服务 SIS

SIS.0304报错 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

一句话识别(http版) - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

一句话识别(websocket版) - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线