搜索_华为云

录音文件识别极速版 - 语音交互服务 SIS

录音文件识别极速版支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
录音文件极速版 - 语音交互服务 SIS

add_punc 否 String 表示是否在识别结果中添加标点，取值为“yes”和“no”，默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。 vocabulary_id 否 String 热词表id，不使用则不填写。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
使用实时语音合成 - 语音交互服务 SIS

设置采样率：8000、16000，默认8000。 SetPitch 否 Integer 设置音高，-500~500，默认0。 SetVolume 否 Integer 设置音量，0~100，默认50。 SetSpeed 否 Integer 设置语速，-500~500，默认0。示例代码如下示

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

add_punc 否 String 表示是否在识别结果中添加标点，取值为“yes”和“no”，默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。 vocabulary_id 否 String 热词表

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
计费说明 - 语音交互服务 SIS
计费说明 - 语音交互服务 SIS

您账号欠费后，会导致部分操作受限，建议您尽快续费。具体受限操作如下所示：若欠费前未调用对应接口，如一句话识别，则默认未开通该接口，欠费后将不可调用，无论是否有套餐包剩余。若欠费前已调用对应接口，则默认开通该接口，欠费后可继续使用至账户被华为云账户中心冻结为止。冻结由账户中心控制，一般情况下套餐包未使用完不会被冻结。

帮助中心 > 语音交互服务 SIS > 产品介绍
语音交互服务的区域如何选择 - 语音交互服务 SIS

音服务支持北京和上海区域，后续会陆续上线其他区域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
Websocket握手请求 - 语音交互服务 SIS

本接口提供实时流式语音合成。用户每次建立连接，发送待合成文本，服务端将合成结果响应给用户。一次连接只能发送一次文本，如果有多段文本需要合成，需要多次建立连接。实时语音合成和语音合成均属于语音合成接口，采用完全相同的计费规则，两者价格梯度可互相叠加，可参考价格计算器。工作流程从流程图可以看出，实时语音合成只需

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口
使用实时语音识别 - 语音交互服务 SIS

表示是否在识别结果中添加标点，取值为yes 、 no，默认no。 SetDigitNorm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。 SetVadHead 否 Integer 头部最大静音时间，[0, 60000]，默认10000ms。 SetVadTail

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
录音文件识别极速版接口 - 语音交互服务 SIS

es”和“no”，默认为“no”。 digit_norm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。 need_word_info 否 String 表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。

帮助中心 > 语音交互服务 SIS > API参考
配置CPP环境（Linux） - 语音交互服务 SIS

websocketpp - glog - gflags - boost 依赖库均以源码形式存放在SDK根目录，SDK默认是开启所有依赖库安装，即运行cmake命令时，SDK会默认安装这些依赖库。如果您在系统中已安装其中一些库，如openssl等，构建的时候可以选择跳过。如 cmake

帮助中心 > 语音交互服务 SIS > SDK参考 > 准备环境
更新热词表 - 语音交互服务 SIS

请求Body参数参数是否必选参数类型描述 name 是 String 热词表名，不可重复。内容限制为字母，数字，下中划线和井号，长度不超过32字节。 description 否 String 热词表描述，长度不超过255字节。 language 是 String 热词表语言类型。

帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
使用实时语音合成 - 语音交互服务 SIS

设置采样率：8000、16000，默认8000。 SetPitch 否 Integer 设置音高，-500~500，默认0。 SetVolume 否 Integer 设置音量，0~100，默认50。 SetSpeed 否 Integer 设置语速，-500~500，默认0。 SetSubtitle

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Linux）
调用说明 - 语音交互服务 SIS
调用说明 - 语音交互服务 SIS

费用，具体计费价格参见语音交互价格计算器。支持两种计费方式：按需计费，默认计费方式为“按需计费”。折扣套餐包方式，是用户可以购买套餐包，扣费时调用次数会先在套餐包内进行抵扣，抵扣完后的剩余调用量默认转回按需计费方式。父主题：使用前必读

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
实时语音识别单句模式 - 语音交互服务 SIS

、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果检测到一段语音的结束点，就会将当前这一段的识别结果返回。和连续识别不同的是，在单句模式下，返回第一段的识别结果

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息 - 语音交互服务 SIS

账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息？解决方案如果是同一个区域的服务，存在套餐会先从套餐计费，超出套餐的部分才会按照按需计费。请确认上述套餐和欠费服务否属于不同服务或者不同区域的。父主题：计费类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 计费类
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

请检查obs_bucket_name和obs_object_key参数是否为空。 SIS.0511 录音文件识别极速版待识别音频无效。请检查音频时长是否满足要求。 SIS.0512 录音文件识别极速版输入参数无效。请检查obs_bucket_name和obs_object_key对应的桶名和文件名是否存在。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
查询热词表信息 - 语音交互服务 SIS

查询热词表信息功能介绍通过热词表id查询热词表的信息和内容。详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /

帮助中心 > 语音交互服务 SIS > API参考 > 热词管理接口
一句话识别 - 语音交互服务 SIS

addPunc 否 String 表示是否在识别结果中添加标点，取值为yes 、 no，默认no。 digitNorm 否 String 表示是否将语音中的数字识别为阿拉伯数字，取值为yes 、 no，默认为yes。 vocabularyId 否 String 热词表id，不使用则不填写。

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
配置OBS访问权限 - 语音交互服务 SIS

OBS全称Object Storage Service（对象存储服务），提供海量、安全、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服务使用成本，降低服务的响应时长，

帮助中心 > 语音交互服务 SIS > API参考 > 附录
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

SDK简介语音交互概述语音交互服务（Speech Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成

 帮助中心 > 语音交互服务 SIS > SDK参考

总条数： 100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

录音文件识别极速版 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

使用实时语音合成 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

计费说明 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

Websocket握手请求 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

配置CPP环境（Linux） - 语音交互服务 SIS

更新热词表 - 语音交互服务 SIS

使用实时语音合成 - 语音交互服务 SIS

调用说明 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

账号中存在语音合成服务的套餐，但是为什么却收到了欠费的信息 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

查询热词表信息 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线