搜索_华为云

调用Java SDK实现一句话识别 - 语音交互服务 SIS

API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java SDK调用一句话识别服务的样例，帮助用户快速了解如何使用Java SDK调用华为云SIS服务。具体操作如下所示：

帮助中心 > 语音交互服务 SIS > 快速入门
一句话识别(http版) - 语音交互服务 SIS

endpoint是华为云各服务应用区域和各服务的终端节点，详情请查看地区和终端节点。请求参数请求类为RecognizeShortAudioRequest，该类的body参数为PostShortAudioReq。 PostShortAudioReq的包含data,和config两个参数，其

 帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
录音文件识别极速版 - 语音交互服务 SIS

录音文件识别极速版支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
一句话识别(websocket版) - 语音交互服务 SIS

needWordInfo 否 String 表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。建立连接 sasrWsClient.connect(); 发送开始识别指令和配置信息 sasrWsClient.sendStart(getStartRequest());

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

功能介绍实时语音识别实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文

 帮助中心 > 语音交互服务 SIS > 产品介绍
SDK（websocket） - 语音交互服务 SIS

SDK时，需要注意旧版本的SDK依赖的jar包与新版本SDK的jar包有无冲突。新版本SDK升级日志为log4j2，同时java-sdk-core升级到3.0.12版本。优先推荐使用新版SDK语音交互服务SDK，该SDK基于统一规范开发，支持Java/Python/C++/.NET/Go/NodeJs/

帮助中心 > 语音交互服务 SIS > SDK参考
语音合成(http版) - 语音交互服务 SIS

build(); endpoint是华为云各服务应用区域和各服务的终端节点，详情请查看地区和终端节点。请求参数请求类为RunTtsRequest,其中包含参数类PostCustomTTSReq，该类包含两个参数text(待合成文本)和TtsConfig，详见TtsConfig。表1

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
录音文件极速版 - 语音交互服务 SIS

add_punc 否 String 表示是否在识别结果中添加标点，取值为“yes”和“no”，默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。 vocabulary_id 否 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件识别极速版接口 - 语音交互服务 SIS

es”和“no”，默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。 need_word_info 否 String 表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。

帮助中心 > 语音交互服务 SIS > API参考
录音文件极速版 - 语音交互服务 SIS

add_punc 否 String 表示是否在识别结果中添加标点，取值为“yes”和“no”，默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。 vocabulary_id 否 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
计费说明 - 语音交互服务 SIS
计费说明 - 语音交互服务 SIS

计费说明计费项一句话识别、语音合成按调用次数计费；实时语音识别、录音文件识别按音频时长计费；录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费，时长计算精确到秒。按音频时长计费的，累加每次调用的音频时长。按调用次数计费的，返回失败的调用不计入次数。调用热词接口，不单独计费。

帮助中心 > 语音交互服务 SIS > 产品介绍
语音合成(webSocket版) - 语音交互服务 SIS

语音合成(webSocket版) 前提条件确保已经按照配置好Android开发环境。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RttsClient，其中参数包含AuthInfo和SisHttpConfig和RttsResponseLi

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
配置热词表（可选） - 语音交互服务 SIS

热词id可以通过控制台，或调用查询热词表信息接口获取。图2 热词id 热词3.0 热词3.0在热词1.0基础上，增加了自定义权重热词和强制替换热词来提升特定场景关键词召回率，如下图3所示。控制台和后端API均已开放热词3.0的创建接口，但需注意的是，并非所有API均能使热词3.0算法生效，具体约束条件如下。

帮助中心 > 语音交互服务 SIS > 用户指南
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

语音合成/实时语音合成语音合成，依托先进的语音技术，使用深度学习算法，将文本转换为自然流畅的语音。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等，可自定义音频格式，为企业和个人提供个性化的发音服务。父主题：使用前必读

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

0511 录音文件识别极速版待识别音频无效。请检查音频时长是否满足要求。 SIS.0512 录音文件识别极速版输入参数无效。请检查obs_bucket_name和obs_object_key对应的桶名和文件名是否存在。 SIS.0513 录音文件识别极速版输入参数无效。请检查o

帮助中心 > 语音交互服务 SIS > API参考 > 附录

总条数： 15

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调用Java SDK实现一句话识别 - 语音交互服务 SIS

一句话识别(http版) - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

一句话识别(websocket版) - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

语音合成(http版) - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

计费说明 - 语音交互服务 SIS

语音合成(webSocket版) - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

概述 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线