搜索_华为云

功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

抗噪性能，使识别准确率显著提升。识别速度快把语言模型、词典和声学模型统一集成为一个大的神经网络，同时在工程上进行了大量的优化，大幅提升解码速度，使识别速度在业内处于领先地位。多种识别模式支持多种实时语音识别模式，如流式识别、连续识别和实时识别模式，灵活适应不同应用场景。定制化服务

 帮助中心 > 语音交互服务 SIS > 产品介绍
调用Java SDK实现一句话识别 - 语音交互服务 SIS

语音交互服务软件开发工具包（SIS SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java SDK调用一句话识别服务的样例，帮助用户快速了解如何使用Java

帮助中心 > 语音交互服务 SIS > 快速入门
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audio_format参数设置的语音格式为准。若audio_format的值设置为wav，则解码后输出为wav格式，如果设置为mp3，则解码后输出mp3格式。

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

采样率，支持“8000”、“16000”，默认“8000”。 property 否 String 特征字符串，{language}_{speaker}_{domain}，默认chinese_xiaoqi_common。具体信息请参见《API参考》中语音合成章节。 isSaved 否 Boolean 是

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

父节点：config property 否 String 语音合成特征字符串，组成形式为{language}_{speaker}_{domain}，即“语种_人员标识_领域”。发音人分为普通发音人和精品发音人，每次调用价格相同，针对精品发音人，每50字计一次调用，不足50字按一次

 帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
实时语音识别连续模式 - 语音交互服务 SIS

连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，将直接丢弃。如果检测到一段语音的结束点，就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音合成(http版) - 语音交互服务 SIS

t二选一即可）。指定region方式（强烈推荐） // 初始化客户端认证信息，使用当前客户端初始化方式可不填 projectId/domainId，以初始化 BasicCredentials 为例 BasicCredentials basicCredentials = new BasicCredentials()

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
流式一句话 - 语音交互服务 SIS

该接口支持用户将一整段语音分段，以流式输入，最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后，仅延迟很短的时间（也即等待处理最后一段语音数据以及获取最终

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别单句模式 - 语音交互服务 SIS

实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果检测到一段语音的结束点，就会将当前这一段的识别结果返回。和连续识别不同的是，在单句模式下，返回第一段的识别结果后，将不再继续识别

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

请检查OBS上音频是否可访问。权限配置方法请参见配置OBS访问权限。 SIS.30004 下载热词文件失败。请检查热词是否存在。 SIS.30006 音频解码失败。请检查音频格式是否正常，音频是否是空文件。 SIS.30007 转写引擎加载热词失败。请检查热词是否存在。 SIS.30008 转写引擎转写失败。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
语音交互服务使用简介 - 语音交互服务 SIS

成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。调用API接口需要具备一定的编程开发能力，返回的结果为JSON格式，用户需要通过编程来处理识别结果。您可以根据以下介绍选择合适的使用方式：通过华为云EI智能体验馆，零基础，一键快速体验语音交互功能。

帮助中心 > 语音交互服务 SIS > 快速入门
错误响应 - 语音交互服务 SIS
错误响应 - 语音交互服务 SIS

配置串错误，包括存在不识别的配置串，或者配置串值的范围不合法。时序不正确，比如连续发送两次“开始识别”指令。识别过程中发生错误，比如音频解码发生错误。出现错误响应时，如果已经在一个会话中了，会再发送一个“结束识别”的响应，表示识别会话结束。如果会话还没有开始，那么发送此错误响

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
websocket接口 - 语音交互服务 SIS

支持采样率为16k的粤语方言语音识别。区域仅支持cn-north-4。max_seconds参数最短时长为10s，当设置低于10s，默认按照10s处理。 shanghai_16k_common 支持采样率为16k的上海话方言语音识别。区域仅支持cn-north-4。max_seconds参数最短时长为10s

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

压缩录音数据。目前仅支持单通道的音频。 amrwb AMR 宽带(16k) 压缩录音数据。目前仅支持单通道的音频。 auto 由引擎自动判断音频数据的格式并解码，支持自动判断amr，flac，m4a，mp3，ogg，webm，wav，aac，ac3，mov，wma、amrwb格式。表6 property取值范围

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

应用场景语音客服质检识别客服、客户的语音，转换为文本。进一步通过文本检索，检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件，进行快速的识别，转化成文字，方便进行会议记录。语音短消息通过语音发送或者接收短消息时，将音频短消息转文字，提升阅读效率和交互体验。

帮助中心 > 语音交互服务 SIS > 产品介绍
配置OBS访问权限 - 语音交互服务 SIS

配置OBS访问权限 OBS服务 OBS全称Object Storage Service（对象存储服务），提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服务使用

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
调用语音交互的API显示auth failed - 语音交互服务 SIS

"password": password, "domain": { "name": domain_name }

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
监控安全风险 - 语音交互服务 SIS

监控安全风险 SIS提供基于云监控服务CES的监控能力，帮助用户监控账号下的SIS服务API，执行自动实时监控、告警和通知操作。用户可以实时掌握API所产生的调用成功次数、调用失败次数等信息。关于SIS支持的监控指标，以及如何创建监控告警规则等内容，请参见语音交互服务的监控指标。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
什么是区域与可用区 - 语音交互服务 SIS

不同区域的资源价格可能有差异，请参见华为云服务价格详情。如何选择可用区是否将资源放在同一可用区内，主要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区

总条数： 68

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

功能介绍 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

语音合成(http版) - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

错误响应 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

调用语音交互的API显示auth failed - 语音交互服务 SIS

监控安全风险 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线