搜索_华为云

什么是语音交互服务 - 语音交互服务 SIS

用户通过调用API接口，将语音文件识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。首次使用SIS 如果您是首次使用SIS的用户，建议您学习并了解如下信息：功能介绍通过功能介绍章节的内容，了解SIS不同功能的具体介绍，主要包括实时语音识别（Real-time

帮助中心 > 语音交互服务 SIS > 产品介绍
语音交互服务的区域如何选择 - 语音交互服务 SIS

语音交互服务的区域如何选择不同区域的资源之间内网不互通。为保证网络的连通性，降低网络时延、提高访问速度，请选择靠近您客户的区域，当前语音服务支持北京和上海区域，后续会陆续上线其他区域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
什么是区域与可用区 - 语音交互服务 SIS

器下。资源的价格不同区域的资源价格可能有差异，请参见华为云服务价格详情。如何选择可用区是否将资源放在同一可用区内，主要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
使用实时语音识别 - 语音交互服务 SIS

初始化RasrClient，其参数包括AuthInfo。表1 AuthInfo 参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 projectId 是 String 项目ID，同region一一对应，参考获取项目ID。

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

体验。智能教育集成语音合成的教育系统可以实现中文标准朗读及带读，应用于课堂和学生自学，提升教学效率。直播实时字幕将视频直播或现场直播中的音频实时转为字幕，为观众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。

帮助中心 > 语音交互服务 SIS > 产品介绍
实时语音识别连续模式 - 语音交互服务 SIS

账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。请求示例（伪码）

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
实时语音识别 - 语音交互服务 SIS

华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。音频采样率8KHz或者16KHz，采样位数8bit或者16bit。支持中文普通话、方言和英语的语音识别，其中方言包括：四川话、粤语和上海话。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
实时语音识别单句模式 - 语音交互服务 SIS

单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果检测到一段语音的结束点，就会将当前这一段的识别结

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

TtsCustomizationClient初始化参数参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如：cn-north-4。具体请参考终端节点。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
使用实时语音合成 - 语音交互服务 SIS

初始化RttsClient，其参数包括AuthInfo 表1 AuthInfo 参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 projectId 是 String 项目ID，同region一一对应，参考获取项目ID。

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
配置CPP环境（Linux） - 语音交互服务 SIS

cmake版本需要在3.14及以上 gcc-c++ 版本需要在5.4.0及以上 Linux版本CPP SDK依赖g++,cmake，此三项需要提前在机器安装，才能完成sdk编译和运行. CentOS yum install gcc-c++ yum install cmake Ununtu

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成的在线使用页面，用户无需编程即可使用服务功能。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
一句话识别Http接口 - 语音交互服务 SIS

isConfig。表1 AuthInfo 参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如cn-north-4，参考终端节点。 projectId

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
创建热词表 - 语音交互服务 SIS

在一句话识别、录音文件识别、实时语音识别服务中，如果在您的业务领域有一些特有的词，默认识别效果差的时候可以考虑使用热词管理功能，将这些词添加到词表，改善识别效果。热词可以是姓名、公司名、某个领域的专有名词，如人名"王晓茗”（通常会识别为"王小明”）、运输域的“高栏”等。热词不建议太长，也不要有标

 帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

终端节点终端节点即调用API的请求地址，不同服务不同区域的终端节点不同。目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

一句话识别可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据，系统经过处理，生成语音对应的文字，支持的语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。产品优势高识别率基于深度学习技术，对特定领域场景的语音识别进行优化，识别率达到业界领先。

帮助中心 > 语音交互服务 SIS > 产品介绍
一句话识别Websocket接口 - 语音交互服务 SIS

isConfig。表1 AuthInfo 参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如cn-north-4，参考终端节点。 projectId

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

录音文件识别接口，用于转写不超过5小时的音频。由于录音文件转写需要较长的时间，因此转写是异步的。表4 语音合成接口说明接口类型说明语音合成/实时语音合成语音合成，依托先进的语音技术，使用深度学习算法，将文本转换为自然流畅的语音。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
配置热词表（可选） - 语音交互服务 SIS

自定义权重热词用/将热词分为两个部分，左边即为普通热词，遵循普通热词的配置规则。右边为1~10的整数（包含），数值越大热词的偏置力度越强，召回率越高（但误召回的风险越大）。图4 配置示例强制替换热词强制替换作为热词功能的补充，主要解决以下两类问题：一些极其罕见的词语，如绵绵瓜瓞，龙行龘（dá）龘，即

 帮助中心 > 语音交互服务 SIS > 用户指南
录音文件极速版 - 语音交互服务 SIS

参数是否必选参数类型描述 audio_format 是 String 支持语音的格式，请参考表4。 property 是 String 所使用的模型特征串，通常是 “语种_采样率_领域”的形式，采样率需要与音频采样率保持一致，取值范围请参考表5。 add_punc 否 String

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK

总条数： 59

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是语音交互服务 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

使用实时语音合成 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

创建热词表 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线