搜索_华为云

一句话识别 - 语音交互服务 SIS

一句话识别 http接口 websocket接口

 帮助中心 > 语音交互服务 SIS > API参考
录音文件识别接口 - 语音交互服务 SIS

录音文件识别接口提交录音文件识别任务获取录音文件识别结果

 帮助中心 > 语音交互服务 SIS > API参考
什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语

 帮助中心 > 语音交互服务 SIS > 产品介绍
实时语音识别接口 - 语音交互服务 SIS

实时语音识别接口接口说明 Websocket握手请求实时语音识别请求实时语音识别响应

 帮助中心 > 语音交互服务 SIS > API参考
实时语音识别响应 - 语音交互服务 SIS

实时语音识别响应开始识别请求响应事件响应识别结果响应错误响应严重错误响应结束识别请求响应父主题：实时语音识别接口

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

ocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、python、c++等开发语言支持Websocket的对应软件包或库接口，与实时语音识别引擎握手连接，并发送语音数据和接收转写结果，最后关闭Websocket连接。获取Websocket握手请求ws

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

构造请求本节介绍REST API请求的组成，并以调用一句话识别接口说明如何调用API。您还可以通过这个视频教程了解如何构造请求调用API：https://bbs.huaweicloud.com/videos/102987 。请求URI 请求URI由如下部分组成。 {URI-scheme}

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

集成语音合成的教育系统可以实现中文标准朗读及带读，应用于课堂和学生自学，提升教学效率。直播实时字幕将视频直播或现场直播中的音频实时转为字幕，为观众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。即时文本录入

 帮助中心 > 语音交互服务 SIS > 产品介绍
调用Java SDK实现一句话识别 - 语音交互服务 SIS

调用Java SDK实现一句话识别语音交互服务软件开发工具包（SIS SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java

帮助中心 > 语音交互服务 SIS > 快速入门
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

请检查OBS是否为公共读状态，或开通了委托授权。 SIS.0701 输入的音频/视频/试题文本大小超过限制。请参考错误信息和API资料，减少音频/视频/试题文本大小。 SIS.0702 输入参数不合法。例如，评测语言/评测模式不支持；音频/视频格式不支持；试题文本无效等情况。请参考错误信息和API资料，更换正确的输入参数。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
Token怎么获取 - 语音交互服务 SIS

”加到请求消息头即可，如下所示。 Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证：https://bbs.huaweicloud.com/videos/101333 。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
提交录音文件识别任务 - 语音交互服务 SIS

默认格式，系统自动判断，支持的音视频格式如下：WAV（内部支持pcm/ulaw/alaw/adpcm编码格式）、AMR、FLAC、M4A、MP3、OGG、WEBM、AAC、AC3、MOV、WMA、MP4、AVI、RMVB、MKV、FLV、F4V、WMV、3GP。支持双声道的音视频。 pcm16k16bit

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
配置OBS访问权限 - 语音交互服务 SIS

托。上传音频在OBS“桶列表”页，单击创建的OBS桶。图2 进入OBS桶进入“对象”页面，将音频数据上传至OBS桶中。图3 上传视频数据获取音频URL 单击已上传的数据名称，进入数据详情页。图4 进入数据详情页复制链接，获取数据URL。图5 获取数据URL 父主题：

帮助中心 > 语音交互服务 SIS > API参考 > 附录
websocket接口 - 语音交互服务 SIS

websocket接口功能介绍一句话识别websocket接口支持识别1min以内的音频，交互过程如图客户端和服务端交互流程所示，主要分为开始识别、发送音频数据，结束识别、断开连接四个步骤。 websocket接口同http接口一致按次计费，只要建立连接成功，发送音频，服务

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
语音合成接口 - 语音交互服务 SIS

语音合成接口语音合成 SSML标记语言介绍

 帮助中心 > 语音交互服务 SIS > API参考
实时语音合成响应 - 语音交互服务 SIS

实时语音合成响应开始合成响应语音合成结果响应语音合成结束响应语音合成错误响应严重错误响应父主题：实时语音合成接口

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口
计费类 - 语音交互服务 SIS
计费类 - 语音交互服务 SIS

计费类套餐包购买后是否支持退款服务当前处于商用还是免费阶段如何收费如何续费查看套餐用量明细、账单明细账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息欠费后充值账户，为什么调用SIS API仍返回'resource type is RESTRICTED' 欠费后套餐包能否继续使用

 帮助中心 > 语音交互服务 SIS > 常见问题
准备环境 - 语音交互服务 SIS
准备环境 - 语音交互服务 SIS

准备环境配置Java环境配置Python环境配置Android 环境配置CPP环境（Windows）配置CPP环境（Linux）

帮助中心 > 语音交互服务 SIS > SDK参考
修订记录 - 语音交互服务 SIS
修订记录 - 语音交互服务 SIS

修订记录发布日期修订说明 2023-09-27 新增： iOS SDK新增一句话识别、实时语音识别连续模式 2023-03-06 新增： CPP SDK支持Linux版本 2022-08-02 新增： Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP

帮助中心 > 语音交互服务 SIS > SDK参考

总条数： 66

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

一句话识别 - 语音交互服务 SIS

录音文件识别接口 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

实时语音识别接口 - 语音交互服务 SIS

实时语音识别响应 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

Token怎么获取 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

语音合成接口 - 语音交互服务 SIS

实时语音合成响应 - 语音交互服务 SIS

计费类 - 语音交互服务 SIS

准备环境 - 语音交互服务 SIS

修订记录 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线