搜索_华为云

提交录音文件识别任务 - 语音交互服务 SIS

您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。URL不能使用IP地址，只能使用域名，请尽量避免中文。音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
录音文件识别多久可以返回结果 - 语音交互服务 SIS

音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。表1 音频转写时长参考表音频时长参考返回时间小于10分钟小于2分钟 10分钟-60分钟

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
SIS.0304报错 - 语音交互服务 SIS
SIS.0304报错 - 语音交互服务 SIS

SIS.0304报错问题现象客户端长时间没有发送语音，服务端超过20s没有收到语音，就会报这个错误。解决方案 1. 检查代码是否存在发送音频后睡眠过多时间。 2. 检查是否发送end请求，是否关闭客户端。超过20s没有发送数据同时也没有断开连接，就会报该错误。在使用完毕后一定要记得断开与服务端连接。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

and the audio will not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
严重错误响应 - 语音交互服务 SIS

严重错误响应严重错误，通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时（例如20s）。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示开始识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
严重错误响应 - 语音交互服务 SIS

严重错误响应功能介绍严重错误，通常指流程无法继续的情况。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示此次合成发生不可恢复的错误。 trace_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
事件响应 - 语音交互服务 SIS
事件响应 - 语音交互服务 SIS

事件响应服务器端检测到某些事件时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为EVENT，表示开始识别响应。 trace_id String 服

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
创建热词表 - 语音交互服务 SIS

表，改善识别效果。热词可以是姓名、公司名、某个领域的专有名词，如人名"王晓茗”（通常会识别为"王小明”）、运输域的“高栏”等。热词不建议太长，也不要有标点符号或者特殊符号。具体限制参见创建热词表更新热词表章节。功能介绍新建一个热词表，创建成功返回id。每个用户限制创建100个热词表。

帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
结束识别请求响应 - 语音交互服务 SIS

结束识别请求响应服务器端收到“结束识别”请求时或语音识别过程中发生错误，服务端会向客户端推送如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为END，表示结束识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
录音文件识别 - 语音交互服务 SIS

否 String 任务创建时间。格式如2018-12-04T13:10:29.310Z。 startTime 否 String 开始识别时间。格式如2018-12-04T13:10:29.310Z。 finishTime 否 String 识别完成时间。格式如2018-12-04T13:10:29

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件识别 - 语音交互服务 SIS

识别过程中发生错误。 create_time 否 String 任务创建时间, 遵循 RFC 3339格式。格式示例：2018-12-04T13:10:29.310Z。 start_time 否 String 开始识别时间, 遵循 RFC 3339格式。当status为FINISHED或ERROR时存在。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
websocket接口 - 语音交互服务 SIS

一句话识别websocket接口支持识别1min以内的音频，交互过程如图客户端和服务端交互流程所示，主要分为开始识别、发送音频数据，结束识别、断开连接四个步骤。 websocket接口同http接口一致按次计费，只要建立连接成功，发送音频，服务开始识别，则本次调用计费生效。如果用户发送错

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
语音交互服务使用简介 - 语音交互服务 SIS

如果您是业务开发者，没有代码编写基础，您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验，不能用于开发。通过可视化工具（如curl、Postman）发送请求调用SIS服务API。如果您是开发初学者，有代码编写基础，对HTTP请求与编程基础有一定的了解，您

 帮助中心 > 语音交互服务 SIS > 快速入门
calc ak sk signature fail:signature expired报错 - 语音交互服务 SIS

口临时访问密钥AK/SK获取；永久安全凭证通过我的凭证界面控制台获取。如果使用的是永久性AK、SK出现此报错。请检查您的服务器时间和网络时间是否一致，时间同步后，可解决该报错。父主题：错误码类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

0303 引擎连接失败。请重试，多次出现请联系专业工程师。 SIS.0304 音频等待超时。客户端长时间没有发送语音，服务端超过20s没有收到语音会产生该报错。请减小数据发送间隔。检查代码是否存在发送音频后睡眠过多时间。检查是否发送end请求，是否关闭客户端。 SIS.0305

帮助中心 > 语音交互服务 SIS > API参考 > 附录
公共请求参数 - 语音交互服务 SIS

采用Base64编码的随机16字节长的字符序列。用来发送给服务器使用，服务器会使用此字段组装成另一个key值放在握手返回信息里发送客户端。 x3JJHMbDL1EzLkh9GBhXDw== Sec-WebSocket-Version 发送WebSocket握手请求时，包含该头域。标识了客户端支持WebSocket协议的版本。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文相关语义特征，并结合语音特征，智能划分断句及添加标点符号，提升输出文本的可阅读性。

帮助中心 > 语音交互服务 SIS > 产品介绍
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

表1 实时语音识别接口说明接口类型说明实时语音识别接口华为云提供的Websocket接口，主要用于实时语音识别。音频分片传输，服务器端可以返回中间临时转写结果，在最后返回最终转写结果。表2 一句话识别接口说明接口类型说明一句话识别一句话识别接口，用于短语音的同

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读

总条数： 100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

提交录音文件识别任务 - 语音交互服务 SIS

录音文件识别多久可以返回结果 - 语音交互服务 SIS

SIS.0304报错 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

事件响应 - 语音交互服务 SIS

创建热词表 - 语音交互服务 SIS

结束识别请求响应 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

calc ak sk signature fail:signature expired报错 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

公共请求参数 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线