搜索_华为云

如何调用WebSocket API - 语音交互服务 SIS

后持续发送语音数据至服务端，最后发送结束消息，在此期间客户端会持续收到服务端发送的转写结果或事件，客户端根据所收到的响应消息做对应处理。实时语音识别接口的具体细节请参见接口说明章节。图1 客户端与服务端交流流程

 帮助中心 > 语音交互服务 SIS > API参考
认证鉴权 - 语音交互服务 SIS
认证鉴权 - 语音交互服务 SIS

Token的有效期为24小时，需要使用同一个Token鉴权时，可以缓存起来，避免频繁调用。 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。代

 帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
录音文件识别极速版 - 语音交互服务 SIS

华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。支持从华为云对象存储服务（OBS）下载音频，需要用户提供OBS桶名和对象键值。父主题：约束与限制

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
创建热词表 - 语音交互服务 SIS

调用热词时，需确保调用热词的区域与创建热词的区域一致。如下图位置可查询创建热词所在区域：图1 热词创建区域查询调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。约束与限制所有含英文的热词均需

 帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
录音文件识别 - 语音交互服务 SIS

格式，详见API参考文档中的“audio_format取值范围”。语音时长不超过5小时，文件大小不超过300M，用户的识别任务在6小时内完成并返回识别结果，识别结果保存72小时（从转写完成的时间算起）。支持中文普通话、四川话识别。父主题：约束与限制

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
实时语音识别 - 语音交互服务 SIS

华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。音频采样率8KHz或者16KHz，采样位数8bit或者16bit。支持中文普通话、方言和英语的语音识别，其中方言包括：四川话、粤语和上海话。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
返回结果 - 语音交互服务 SIS
返回结果 - 语音交互服务 SIS

返回结果状态码请求发送以后，您会收到响应，包含状态码、响应消息头和消息体。状态码是一组从1xx到5xx的数字代码，状态码表示了请求响应的状态，完整的状态码列表请参见状态码。对于SIS服务接口，如果调用后返回状态码为“200”，则表示请求成功。响应消息头对应请求消息头，

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
身份认证与访问控制 - 语音交互服务 SIS

身份认证与访问控制身份认证用户访问SIS的方式有多种，包括SIS控制台、API、SDK，无论访问方式封装成何种形式，其本质都是通过SIS提供的API接口进行请求。 SIS的接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。 Token认证：通过Token认证调用请求。 AK/SK认证：通过AK（Access

帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
如何查看当前接口是否免费调用 - 语音交互服务 SIS

套餐包购买时长为1年，可通过叠加套餐包累加API调用次数或时长。购买的套餐包在生效期内，扣费方式是先扣除已购买的套餐包内的额度后，超出部分以按需计费的方式进行结算。购买的套餐包到期后如果没有购买新的套餐包，系统会自动转为按需计费。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

体验。智能教育集成语音合成的教育系统可以实现中文标准朗读及带读，应用于课堂和学生自学，提升教学效率。直播实时字幕将视频直播或现场直播中的音频实时转为字幕，为观众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。

帮助中心 > 语音交互服务 SIS > 产品介绍
APIG.0201报错 - 语音交互服务 SIS

APIG.0201报错如果调用API时返回错误信息与错误码："error_msg":"Backend timeout.","error_code":"APIG.0201"，表示请求超时。您可以尝试以下方案进行解决。使用Postman等工具直接调用服务，查看是否成功，如果调用

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
计费说明 - 语音交互服务 SIS
计费说明 - 语音交互服务 SIS

或时长。购买的套餐包在生效期内，扣费方式是先扣除已购买的套餐包内的额度后，超出部分以按需计费的方式进行结算。购买的套餐包到期后如果没有购买新的套餐包，系统会自动转为按需计费。变更配置 SIS默认使用按需计费。您也可以根据您的实际情况购买资源包，购买后对应区域的资源将自动转为

 帮助中心 > 语音交互服务 SIS > 产品介绍
SSML标记语言介绍 - 语音交互服务 SIS

Language）标记语言的功能、标签使用及示例。概述 SSML 是一种基于 XML 的语音合成标记语言。使用 SSML 可以更加准确、具体的定义合成音频的效果，包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成，有更好的操作灵活性。华为云语音合成服务的SSML实现，基于W3C的语音合成标记语言版本1

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
配置热词表（可选） - 语音交互服务 SIS

用于提升热词召回率，主要应用于以下场景。所配置的关键词与常见词发音一样，导致热词不能百分百生效。如雇工 vs 故宫。由于故宫更加常见，所以可能存在即使配置了雇工这个热词，也无法召回的情况。所配置的关键词含有生僻字，如葳蕤，霜蟾。这些生僻字出现的概率较低，所以在热词搜索过程中，可能不生效。所配置的关键词较常见，与其他高频词容易混淆（误召回），如述职

 帮助中心 > 语音交互服务 SIS > 用户指南
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

resource-path 资源路径，即API访问路径。从具体API的URI模块获取，例如“一句话识别”API的resource-path为的“/v1/{project_id}/asr/short-audio”。其中“project_id”需要替换成用户的项目ID，可参考获取项目ID。 query-string

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

如果设置为0，表示不检测“长时间静音”情况。取值范围：[0, 60000]的整数，单位为ms，默认为10000ms，即10s。 vad_tail 否 Integer 音频的结尾中的静音时间，正常情况下不应设成很小的值。如果检测语音结尾的静音时长大于等于此值时，在实时语音识别单句模式下将返回VO

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
提交录音文件识别任务 - 语音交互服务 SIS

账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。表4 请求Body参数

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
调用Java SDK实现一句话识别 - 语音交互服务 SIS

SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java SDK调用一句话识别服务的样例，帮助用户快速了解如何使用Java

帮助中心 > 语音交互服务 SIS > 快速入门
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

invalid报错，请使用存放在OBS的音频文件路径，并确保OBS的region要和请求服务的region保持一致。 SIS.0535 录音文件识请求的文件类型不支持。确保设置的audio_format格式的值是合法。录音文件识别支持的音频格式如表7所示。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。

帮助中心 > 语音交互服务 SIS > API参考 > 附录

总条数： 41

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何调用WebSocket API - 语音交互服务 SIS

认证鉴权 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

创建热词表 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

返回结果 - 语音交互服务 SIS

身份认证与访问控制 - 语音交互服务 SIS

如何查看当前接口是否免费调用 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

APIG.0201报错 - 语音交互服务 SIS

计费说明 - 语音交互服务 SIS

SSML标记语言介绍 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线