搜索_华为云

SDK（新版） - 语音交互服务 SIS

Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能，但该SDK暂不支持通过websocket的方法调用的API。如需使用websocket接口，请前往SDK（websocket）。在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能，降低您使用SDK的难度，推荐使用。

帮助中心 > 语音交互服务 SIS > SDK参考
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
获取录音文件识别结果 - 语音交互服务 SIS

获取录音文件识别结果功能介绍该接口用于获取录音文件识别结果及识别状态。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
SSML标记语言介绍 - 语音交互服务 SIS

SSML标记语言介绍本文为您介绍SSML（Speech Synthesis Markup Language）标记语言的功能、标签使用及示例。概述 SSML 是一种基于 XML 的语音合成标记语言。使用 SSML 可以更加准确、具体的定义合成音频的效果，包括控制断句分词方式、发

 帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
与其他云服务的关系 - 语音交互服务 SIS

统一身份认证服务统一身份认证（Identity and Access Management，简称IAM）服务，IAM为语音交互服务提供了用户认证和鉴权功能。对象存储服务 SIS服务接口支持从对象存储服务（Object Storage Service，OBS）上采用临时授权和匿名公开授权的方

 帮助中心 > 语音交互服务 SIS > 产品介绍
提交录音文件识别任务 - 语音交互服务 SIS

SIS服务控制台提供了录音文字识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。接口约束录音时长不超过5小时，文件大小不超过300M。8k采样率音频最小为1

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > 语音交互服务 SIS > API参考
一句话识别(http版) - 语音交互服务 SIS

withIgnoreSSLVerification(true); 配置认证信息。配置AK、SK、project_id信息。华为云通过AK识别用户的身份，通过SK对请求数据进行签名验证，用于确保请求的机密性、完整性和请求者身份的正确性。使用永久AK和SK BasicCredentials basicCredentials

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
语音交互服务需要申请什么权限 - 语音交互服务 SIS

语音交互服务需要申请什么权限语音交互服务本身无权限限制，用户不需要额外添加任何权限，即可对语音交互服务执行操作。但是如下场景除外：当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object Storage

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

http接口功能介绍一句话识别接口，用于短语音的同步识别。一次性上传1min以内音频，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

SIS服务控制台提供了语音合成的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/tts

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
创建热词表 - 语音交互服务 SIS

可以考虑使用热词管理功能，将这些词添加到词表，改善识别效果。热词可以是姓名、公司名、某个领域的专有名词，如人名"王晓茗”（通常会识别为"王小明”）、运输域的“高栏”等。热词不建议太长，也不要有标点符号或者特殊符号。具体限制参见创建热词表更新热词表章节。功能介绍新建一个热词表

 帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
配置热词表（可选） - 语音交互服务 SIS

配置热词表（可选）调用一句话识别、录音文件识别、实时语音识别API时，如果在您的业务领域有一些特有的词，默认识别效果差的时候可以考虑使用热词管理功能，将这些词添加到词表，改善识别效果。创建热词表（1.0版本）创建热词表有两种方式：控制台创建、调用API创建。本章节主要介绍通过控制台创建的方法。

帮助中心 > 语音交互服务 SIS > 用户指南
数据保护技术 - 语音交互服务 SIS

在使用语音交互服务过程中委托我们处理的语音音频和文本等数据，您完全拥有上述数据所有权及控制权，您应自行对上述数据来源和获取的合法性负责，华为云受托处理您的数据，以实现本服务功能或目的：（1）将语音音频数据识别转换成文本。（2）将文本数据合成语音。您的上述数据将在中华人民共和国境内处理，处理完后立即删除，华为云不会保存以上数据。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别连续模式功能介绍连续识别模式的语音总长度限制为五小时，适合于会议、演讲和直播等场景。连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
API概览 - 语音交互服务 SIS
API概览 - 语音交互服务 SIS

Transfer）API，支持您通过HTTPS请求调用，请参见表1。也包含WebSocket接口，支持Websocket协议，请参见表2。表1 REST API功能接口功能 API URI 一句话识别接口一句话识别 POST /v1/{project_id}/asr/short-audio 录音文件识别接

 帮助中心 > 语音交互服务 SIS > API参考
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
语音交互服务使用简介 - 语音交互服务 SIS

您可以根据以下介绍选择合适的使用方式：通过华为云EI智能体验馆，零基础，一键快速体验语音交互功能。如果您是业务开发者，没有代码编写基础，您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验，不能用于开发。通过可视化工具（如curl、Postman）发送请求调用SIS服务API。

帮助中心 > 语音交互服务 SIS > 快速入门
配置OBS访问权限 - 语音交互服务 SIS

下OBS的音频链接作为传入音频的URL。考虑到数据的安全，语音交互服务无法直接获取到用户OBS数据，需要用户开启公共读授权或者语音交互服务授权。开启公共读授权开启公共授权，则数据全网可见，所有用户均可访问，不推荐使用此方法，该方法仅针对同一region服务有效。配置公共读

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
开始合成响应 - 语音交互服务 SIS

开始合成响应功能介绍语音合成引擎收到实时语音合成请求时，首先向客户端发送合成开始响应，表示开始处理语音合成请求。响应消息表1 响应参数名称参数类型说明 resp_type String 响应类型。参数值为START，表示开始语音合成。 trace_id String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应

总条数： 58

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SDK（新版） - 语音交互服务 SIS

概述 - 语音交互服务 SIS

获取录音文件识别结果 - 语音交互服务 SIS

SSML标记语言介绍 - 语音交互服务 SIS

与其他云服务的关系 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

一句话识别(http版) - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

创建热词表 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

API概览 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

开始合成响应 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线