搜索_华为云

提交录音文件识别任务 - 语音交互服务 SIS

gion不一致，可考虑使用obs签名。您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。URL不能使用IP地址，只能使用域名，请尽量避免中文。音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
录音文件识别 - 语音交互服务 SIS

request.setSpeed(true); // 设置回调地址，设置后音频转写结果将直接发送至回调地址。请务必保证地址可联通,不支持ip地址。 // request.setCallbackUrl(""); // 设置热词id，不使用则不用填写 // request

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件识别 - 语音交互服务 SIS

set_emotion(True) # 设置是否需要返回语速信息，默认True，需要need_analysis_info设置为True才生效。 asrc_request.set_speed(True) # 设置回调地址，设置后音频转写结果将直接发送至回调地址。请务必保证地址可联通。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

终端节点即调用API的请求地址，不同服务不同区域的终端节点不同。目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
录音文件识别极速版接口 - 语音交互服务 SIS

es”和“no”，默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。 need_word_info 否 String 表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。

帮助中心 > 语音交互服务 SIS > API参考
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
什么是区域与可用区 - 语音交互服务 SIS

什么是区域、可用区我们用区域和可用区来描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
严重错误响应 - 语音交互服务 SIS

严重错误响应功能介绍严重错误，通常指流程无法继续的情况。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示此次合成发生不可恢复的错误。 trace_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
严重错误响应 - 语音交互服务 SIS

严重错误响应严重错误，通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时（例如20s）。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示开始识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

0535"，错误信息显示为："Audio format is invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
事件响应 - 语音交互服务 SIS
事件响应 - 语音交互服务 SIS

事件响应服务器端检测到某些事件时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为EVENT，表示开始识别响应。 trace_id String 服

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
配置Python环境 - 语音交互服务 SIS

websocket-client。操作步骤下载SDK，通过pip-list命令查看安装包。若未安装，则执行以下命令： pip install setuptools pip install requests pip install websocket-client 进入下载的Python

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
SDK（websocket） - 语音交互服务 SIS

SDK、CPP SDK（Windows）、CPP SDK（Linux）。当前自研SDK仅java和python提供企业项目配置入口，在代码示例中配置，其他语言暂未支持。表1 下载SDK包 SDK语言下载地址 Java https://sis-sdk-repository.obs.cn-north-1

帮助中心 > 语音交互服务 SIS > SDK参考
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
调用Java SDK实现一句话识别 - 语音交互服务 SIS

从Eclipse官网下载并安装Eclipse IDE for Java Developers最新版本，例如：eclipse-jee-mars-R-win32-x86_64.zip。具体操作请参见配置Java环境章节。新建SIS Java SDK工程。解压eclipse后，直接打开。在主菜单选择“Window

帮助中心 > 语音交互服务 SIS > 快速入门
语音合成(webSocket版) - 语音交互服务 SIS

确保已经按照配置好Android开发环境。初始化Client 初始化RttsClient，其中参数包含AuthInfo和SisHttpConfig和RttsResponseListener。其中AuthInfo和SisHttpConfig的参数如表1所示。表1 AuthInfo 参数名称是否必选参数类型

 帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成功能介绍语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
配置Java环境 - 语音交互服务 SIS

Eclipse 在Eclipse官网下载对应平台的Eclipse版本，比如：eclipse-jee-mars-R-win32-x86_64.zip。 Idea 在Idea官网下载对应平台的idea版本，比如：ideaIU-2023.2.2.exe。导入SDK Eclipse导入SDK。

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
更新热词表 - 语音交互服务 SIS

请求Body参数参数是否必选参数类型描述 name 是 String 热词表名，不可重复。内容限制为字母，数字，下中划线和井号，长度不超过32字节。 description 否 String 热词表描述，长度不超过255字节。 language 是 String 热词表语言类型。

帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口

总条数： 84

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

提交录音文件识别任务 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

事件响应 - 语音交互服务 SIS

配置Python环境 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

语音合成(webSocket版) - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

配置Java环境 - 语音交互服务 SIS

更新热词表 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线