搜索_华为云

获取录音文件识别结果 - 语音交互服务 SIS

情绪类型，目前仅支持NORMAL（正常），ANGRY（愤怒），UNKNOWN（未知）。在识别配置中emotion为true时存在。 speed 否 Float 语速信息，单位是每秒字数。在识别配置中speed为true时存在。表7 WordInfo 参数是否必选参数类型描述 start_time

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数名称参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
服务开通、关闭说明 - 语音交互服务 SIS

服务开通、关闭说明使用SIS服务，无需显性执行开通操作，注册华为账号并开通华为云后，账户未欠费，即可调用SIS服务，调用成功后即认为已开通调用接口。此时计费方式为按需计费，不使用不计费。若用户从未调用过SIS服务接口，账户欠费则会被拦截，无法调用。您也可以在控制台购买套餐包，

帮助中心 > 语音交互服务 SIS > 用户指南
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

使用实时语音识别时请确认是否分片发送音频，并在wss握手后发送start命令。报错data url is empty，时请参考配置OBS访问权限，设置OBS权限，并检查使用的URL是否正确。报错data base64 encode invalid，请检查语音转Base64后的

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

not be recognized”？可能原因实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

String 表示客户端结束识别请求，参数值设置为END。 cancel 否 Boolen 是否取消返回识别结果。 true：表示取消识别，也即丢弃识别中和未识别的语音数据并结束，不返回剩余的识别结果。 false：表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
SDK（websocket） - 语音交互服务 SIS

SDK、CPP SDK（Windows）、CPP SDK（Linux）。当前自研SDK仅java和python提供企业项目配置入口，在代码示例中配置，其他语言暂未支持。表1 下载SDK包 SDK语言下载地址 Java https://sis-sdk-repository.obs

帮助中心 > 语音交互服务 SIS > SDK参考
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

表1 实时语音识别接口说明接口类型说明实时语音识别接口华为云提供的Websocket接口，主要用于实时语音识别。音频分片传输，服务器端可以返回中间临时转写结果，在最后返回最终转写结果。表2 一句话识别接口说明接口类型说明一句话识别一句话识别接口，用于短语音的同

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
责任共担 - 语音交互服务 SIS
责任共担 - 语音交互服务 SIS

、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云安全性的构建思

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
实时语音识别连续模式 - 语音交互服务 SIS

于静音段将不会进行特征提取和解码操作，因而能更有效地利用CPU。而流式识别通常和客户端的端点检测功能相结合，只将检测到的有效语音段上传到服务器进行识别。 wss-URI wss-URI格式 wss /v1/{project_id}/rasr/continue-stream 参数说明

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

音识别单句模式”三种模式。三种模式的握手请求wss-URI不同，基于Websocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、python、c++等开发语言支持Websocket的对应软件包或库接口，与实时语音识别引擎握手连接，并发送语音数据和接收

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

为何调用一句话识别的api接口，返回错误码"SIS.0032"，错误信息为:"'audio_format' is invalid"？解决方案确保设置的audio_format格式的值是合法，待识别的音频格式和audio_format参数格式要保证一致。一句话识别支持的音频格式详见表1。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
准备环境 - 语音交互服务 SIS
准备环境 - 语音交互服务 SIS

准备环境配置Java环境配置Python环境配置Android 环境配置CPP环境（Windows）配置CPP环境（Linux）

帮助中心 > 语音交互服务 SIS > SDK参考
应用场景简介 - 语音交互服务 SIS

应用场景简介 SIS支持通过企业项目管理（EPS）对不同用户组和用户的资源使用，进行分账。企业可以根据组织架构规划不同的企业项目，并为每个企业项目设置拥有不同权限的用户组和用户，多个企业项目之间相互独立，资源分开结算。企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注

 帮助中心 > 语音交互服务 SIS > 用户指南 > 企业项目管理
部署类 - 语音交互服务 SIS
部署类 - 语音交互服务 SIS

部署类语音交互服务是否支持私有化部署

 帮助中心 > 语音交互服务 SIS > 常见问题
身份认证与访问控制 - 语音交互服务 SIS

签名值，该签名值以请求者的访问密钥（AK/SK）作为加密因子，结合请求体携带的特定信息计算而成。通过访问密钥（AK/SK）认证方式进行认证鉴权，即使用Access Key ID（AK）/Secret Access Key（SK）加密的方法来验证某个请求发送者身份。关于访问密钥的详细介绍及获取方式，请参见认证鉴权。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
附录 - 语音交互服务 SIS
附录 - 语音交互服务 SIS

附录示例音频获取项目ID 获取账号ID 获取AK/SK 公共请求参数公共响应参数状态码错误码配置OBS访问权限

 帮助中心 > 语音交互服务 SIS > API参考

总条数： 98

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取录音文件识别结果 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

服务开通、关闭说明 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

责任共担 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

准备环境 - 语音交互服务 SIS

应用场景简介 - 语音交互服务 SIS

部署类 - 语音交互服务 SIS

身份认证与访问控制 - 语音交互服务 SIS

附录 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线