搜索_华为云

什么是语音交互服务 - 语音交互服务 SIS

什么是语音交互服务语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能，将口述音频或者语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语

 帮助中心 > 语音交互服务 SIS > 产品介绍
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

http接口功能介绍一句话识别接口，用于短语音的同步识别。一次性上传1min以内音频，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
公共请求参数 - 语音交互服务 SIS

公共请求参数公共请求参数如表公共请求参数所示。表1 公共请求参数参数是否必选说明示例 Content-type 是发送的实体的MIME类型。 application/json Content-Length POST/PUT请求必填。 GET不能包含。请求body长度，单位为Byte。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
API概览 - 语音交互服务 SIS
API概览 - 语音交互服务 SIS

API概览 SIS服务提供了两种接口，包含REST（Representational State Transfer）API，支持您通过HTTPS请求调用，请参见表1。也包含WebSocket接口，支持Websocket协议，请参见表2。表1 REST API功能接口功能 API

帮助中心 > 语音交互服务 SIS > API参考
Token与Project ID不匹配报错 - 语音交互服务 SIS

Token与Project ID不匹配报错获取Token时，出现the parameters of requesting token are wrong or project_id doesn't match the token报错。检查获取Token过程中，请求url中的区

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
配置CPP环境（Linux） - 语音交互服务 SIS

配置CPP环境（Linux） c++版本需要在11及以上 cmake版本需要在3.14及以上 gcc-c++ 版本需要在5.4.0及以上 Linux版本CPP SDK依赖g++,cmake，此三项需要提前在机器安装，才能完成sdk编译和运行. CentOS yum install

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
websocket接口 - 语音交互服务 SIS

websocket接口功能介绍一句话识别websocket接口支持识别1min以内的音频，交互过程如图客户端和服务端交互流程所示，主要分为开始识别、发送音频数据，结束识别、断开连接四个步骤。 websocket接口同http接口一致按次计费，只要建立连接成功，发送音频，服务

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
配置OBS访问权限 - 语音交互服务 SIS

配置OBS访问权限 OBS服务 OBS全称Object Storage Service（对象存储服务），提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
语音交互服务需要申请什么权限 - 语音交互服务 SIS

语音交互服务需要申请什么权限语音交互服务本身无权限限制，用户不需要额外添加任何权限，即可对语音交互服务执行操作。但是如下场景除外：当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
提交录音文件识别任务 - 语音交互服务 SIS

提交录音文件识别任务录音文件识别接口，用于识别长录音文件，支持中文普通话、四川话识别。录音文件放在OBS（对象存储服务）或公网可访问的服务器上。由于录音文件识别通常会需要较长的时间，因此识别是异步的，即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
严重错误响应 - 语音交互服务 SIS

严重错误响应严重错误，通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时（例如20s）。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数参数名参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示开始识别响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
严重错误响应 - 语音交互服务 SIS

严重错误响应功能介绍严重错误，通常指流程无法继续的情况。出现严重错误响应时，流程不再继续，服务器端会主动断连。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为FATAL_ERROR，表示此次合成发生不可恢复的错误。 trace_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
语音合成错误响应 - 语音交互服务 SIS

语音合成错误响应功能介绍合成引擎处理合成请求时如果发生错误则返回该响应。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为ERROR，表示错误响应。 trace_id String 服务内部的令牌，可用于在日志中追溯具体流程。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应
SSML标记语言介绍 - 语音交互服务 SIS

SSML标记语言介绍本文为您介绍SSML（Speech Synthesis Markup Language）标记语言的功能、标签使用及示例。概述 SSML 是一种基于 XML 的语音合成标记语言。使用 SSML 可以更加准确、具体的定义合成音频的效果，包括控制断句分词方式、发

 帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
错误码类 - 语音交互服务 SIS
错误码类 - 语音交互服务 SIS

错误码类 SIS.0304报错 SIS.0103报错 SIS.0032报错 SIS.0535报错 APIG.0101报错 APIG.0201报错 APIG.0301报错账密报错“The username or password is wrong.” Token与Project ID不匹配报错

 帮助中心 > 语音交互服务 SIS > 常见问题
错误响应 - 语音交互服务 SIS
错误响应 - 语音交互服务 SIS

错误响应错误响应，通常是指不影响流程，但当前会话无法再进行下去的错误，包括如下情况：配置串错误，包括存在不识别的配置串，或者配置串值的范围不合法。时序不正确，比如连续发送两次“开始识别”指令。识别过程中发生错误，比如音频解码发生错误。出现错误响应时，如果已经在一个会话中

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成功能介绍语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
开始语音合成请求 - 语音交互服务 SIS

开始语音合成请求功能介绍客户端与语音合成引擎建立Websocket连接后，可以发送开始语音合成请求进行语音合成。如果客户端基于该Websocket连接发送多次合成请求，需在每次请求重新建立websocket连接，一次连接只能处理一次合成请求。请求消息表1 参数说明名称参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求

总条数： 116

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是语音交互服务 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

公共请求参数 - 语音交互服务 SIS

API概览 - 语音交互服务 SIS

Token与Project ID不匹配报错 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

严重错误响应 - 语音交互服务 SIS

语音合成错误响应 - 语音交互服务 SIS

SSML标记语言介绍 - 语音交互服务 SIS

错误码类 - 语音交互服务 SIS

错误响应 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线