搜索_华为云

如何修改发音人 - 语音交互服务 SIS

n", "speed": 10, "pitch": 10, "volume": 60 } } 表1 普通发音人property取值范围 property取值说明 chinese_xiaoqi_common 小琪，标准女声发音人。 chinese_xiaoyu_common

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
一句话识别 - 语音交互服务 SIS

it、wav、amr、amrwb等多种格式，详见API参考文档中的“audio_format取值范围”。音频时长不超过1分钟。支持中文普通话、方言和英语的语音识别，其中方言包括：四川话、粤语和上海话。方言仅支持“华北-北京四”区域，英语仅支持“华东-上海一”区域。父主题：

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
支持哪些语言 - 语音交互服务 SIS

支持哪些语言录音文件识别、语音合成支持中文普通话。一句话识别和实时语音识别支持中文普通话，带方言口音的普通话和方言（四川话、粤语和上海话）。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
修订记录 - 语音交互服务 SIS
修订记录 - 语音交互服务 SIS

整改SDK手册 2019-09-25 新增：语音合成章节 2019-08-06 新增：语音识别章节修改： Runtime Exception修改为Checked Exception 2019-07-30 新增：实时语音识别章节 2019-07-02 下线了ASR SDK的长语音识别功能。

帮助中心 > 语音交互服务 SIS > SDK参考
配置热词表（可选） - 语音交互服务 SIS

所配置的关键词较常见，与其他高频词容易混淆（误召回），如述职 vs 数值。配置规则：自定义权重热词用/将热词分为两个部分，左边即为普通热词，遵循普通热词的配置规则。右边为1~10的整数（包含），数值越大热词的偏置力度越强，召回率越高（但误召回的风险越大）。图4 配置示例强制替换热词

 帮助中心 > 语音交互服务 SIS > 用户指南
热词管理 - 语音交互服务 SIS
热词管理 - 语音交互服务 SIS

热词表名，创建时不可重复。内容限制为字母，数字，下中划线和井号，长度不超过32字节。 language 是 String 热词表语言类型，目前支持汉语普通话“chinese_mandarin”。 contents 是 Array of String 热词库，单词库支持热词数上限10000。中文单个热词长度上限32字节。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
提交录音文件识别任务 - 语音交互服务 SIS

n-north-4，cn-east-3，强烈推荐使用） chinese_8k_common（中文普通话语音识别） chinese_16k_conversation（会议场景的中文普通话语音识别） sichuan_8k_common（四川话识别，区域支持cn-north-4，cn-east-3）

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

人分为普通发音人和精品发音人，每次调用价格相同，针对精品发音人，每50字计一次调用，不足50字按一次计；普通发音人每100字计一次调用，不足100字按一次计。其中1个汉字、1个英文字母或1个标点均算作1个字符，具体费用请参考价格计算器。普通发音人：取值范围请参考表普通发音人property取值范围。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
SDK简介 - 语音交互服务 SIS
SDK简介 - 语音交互服务 SIS

Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会

 帮助中心 > 语音交互服务 SIS > SDK参考
语音交互服务使用简介 - 语音交互服务 SIS

获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

帮助中心 > 语音交互服务 SIS > 快速入门
录音文件识别 - 语音交互服务 SIS

语音时长不超过5小时，文件大小不超过300M，用户的识别任务在6小时内完成并返回识别结果，识别结果保存72小时（从转写完成的时间算起）。支持中文普通话、四川话识别。父主题：约束与限制

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
什么是语音交互服务 - 语音交互服务 SIS

plication Programming Interface，应用程序编程接口）获取语音交互结果。例如用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
实时语音识别 - 语音交互服务 SIS

华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。音频采样率8KHz或者16KHz，采样位数8bit或者16bit。支持中文普通话、方言和英语的语音识别，其中方言包括：四川话、粤语和上海话。方言和英语仅支持“华北-北京四”区域。端点检测参数（vad_head、v

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

Interaction Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

chinese_8k_general 支持采样率为8k的中文普通话语音识别，采用新一代端到端识别算法，识别准确率更高。区域支持cn-east-3和cn-north-4（强烈推荐使用）。 chinese_16k_general 支持采样率为16k的中文普通话语音识别，采用新一代端到端识别算法，识别准确率更高。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

功能介绍实时语音识别实时语音识别服务，用户通过实时访问和调用API获取实时语音识别结果，支持的语言包含中文普通话、方言和英语，方言当前支持四川话、粤语和上海话。文本时间戳为音频转换结果生成特定的时间戳，从而通过搜索文本即可快速找到对应的原始音频。智能断句通过提取上下文

 帮助中心 > 语音交互服务 SIS > 产品介绍
开始语音合成请求 - 语音交互服务 SIS

String 否可参考表3和表4。默认：chinese_xiaoyan_common 实时语音合成和语音合成属于同一种资源，按次计费。实时语音合成普通发音人，每100字计一次。精品发音人每50字计一次。 speed Integer 否语速。取值范围：-500~500 默认值：0 pitch

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
认证鉴权 - 语音交互服务 SIS
认证鉴权 - 语音交互服务 SIS

AK/SK认证就是使用AK/SK对请求进行签名，在请求时将签名信息添加到消息头，从而通过身份认证。 AK(Access Key ID)：访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。 SK(Secret Access Key)：与访问密钥ID结合使用的密钥

 帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

chinese_16k_general 支持采样率为16k的中文普通话语音识别，采用新一代端到端识别算法，识别准确率更高。区域支持cn-east-3和cn-north-4（强烈推荐使用）。 chinese_16k_travel 支持采样率为16k的中文普通话语音识别，采用新一代端到端识别算法，并针对网约车质检场景进行了优化。

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
websocket接口 - 语音交互服务 SIS

chinese_8k_common 支持采样率为8k的中文普通话语音识别。 chinese_16k_common 支持采样率为16k的中文普通话语音识别。 sichuan_16k_common 支持采样率为16k的中文普通话与四川话方言语音识别。区域仅支持cn-north-4。m

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别

总条数： 42

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何修改发音人 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

支持哪些语言 - 语音交互服务 SIS

修订记录 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

热词管理 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

SDK简介 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

认证鉴权 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线