搜索_华为云

录音文件识别 - 语音交互服务 SIS

aw16k8bit、ulaw8k8bit、alaw16k8bit、alaw8k8bit、WAV（支持pcm/ulaw/alaw/adpcm编码格式）、MP3、M4A、ogg-speex、ogg-opus、AMR等多种格式，详见API参考文档中的“audio_format取值范围”。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。语音交互（实时语音识别、一句话识别、录音

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
什么是语音交互服务 - 语音交互服务 SIS

取语音交互结果。例如用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式，从封装头中自动确定格式，目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。 amrwb AMR 宽带(16k) 压缩录音数据。目前仅支持单通道的音频。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

录音文件识别支持的音频格式 audioformat取值说明 auto 自动判断，系统会自动判断并支持WAV（内部支持pcm/ulaw/alaw/adpcm编码格式）、MP3、M4A、ogg-speex、ogg-opus、AMR、wma等格式，相应的文件后缀名为.wav, .mp3, .m4a,

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
一句话识别Http接口 - 语音交互服务 SIS

表3 AsrCustomShortRequest 参数名称是否必选参数类型描述 data 是 String 本地音频文件经过Base64编码后的字符串，音频文件时长不超过1min。 audio_format 是 String 音频格式，具体信息请参见《API参考》中一句话识别章节。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
一句话识别 - 语音交互服务 SIS

是否必选参数类型描述 config 是 Config object 配置信息。 data 是 String 本地音频文件经过Base64编码后的字符串，音频文件时长小于60s。表3 Config 参数名称是否必选参数类型描述 audioFormat 是 String 音

 帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

请求消息体通常以结构化格式发出，与请求消息头中Content-type对应，传递除请求消息头之外的内容。若请求消息体中参数支持中文，则中文字符必须为UTF-8编码。每个接口的请求消息体内容不同，也并不是每个接口都需要有请求消息体（或者说消息体为空），GET、DELETE操作类型的接口就不需要消息体，消息体具体内容需要根据具体接口而定。

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
API使用类 - 语音交互服务 SIS
API使用类 - 语音交互服务 SIS

调用语音交互的API超时怎么处理（connect timeout）为什么服务端返回OBS链接不可用（data url is unreachable）语音合成的base64编码如何使用录音文件识别多久可以返回结果语音合成能不能支持返回立体音（双声道）格式的音频如何解决“The silence time is

帮助中心 > 语音交互服务 SIS > 常见问题
录音文件极速版 - 语音交互服务 SIS

表示在OBS对象桶名，使用前请先授权，操作方法请参见配置OBS访问权限。obs_bucket_name长度大于等于3个字符，小于64个字符，不需要进行urlencode编码，如果包含中文，直接输入中文即可。示例 obs url为https://test.obs.cn-north-4.myhuaweicloud

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
一句话识别Http接口 - 语音交互服务 SIS

表3 AsrCustomShortRequest 参数名称是否必选参数类型描述 data 是 String 本地音频文件经过Base64编码后的字符串，音频文件时长不超过1min。 audioFormat 是 String 音频格式，具体信息请参见《API参考》中一句话识别章节。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
调用API或SDK - 语音交互服务 SIS

调用API或SDK 在线调试本地调用

 帮助中心 > 语音交互服务 SIS > 用户指南
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

Result 参数名是否必选参数类型说明 data 是 String 合成后生成的语音数据，以Base64编码格式返回。用户如需生成音频，需要将Base64编码解码成byte数组，再保存为wav音频。代码示例如下示例仅供参考，最新代码请前往SDK（websocket）章节获取并运行。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
语音交互服务使用简介 - 语音交互服务 SIS

成接口等。用户通过调用语音识别类接口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。调用API接口需要具备一定的编程开发能力，返回的结果

 帮助中心 > 语音交互服务 SIS > 快速入门
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

true才生效。表5 Result 参数名称是否必选参数类型说明 data 是 String 合成后生成的语音数据，以Base64编码格式返回。代码示例如下示例仅供参考，最新代码请前往SDK（websocket）章节获取并运行。 # -*- coding: utf-8

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件极速版 - 语音交互服务 SIS

表示在OBS对象桶名，使用前请先授权，操作方法请参见配置OBS访问权限。obs_bucket_name长度大于等于3个字符，小于64个字符，不需要进行urlencode编码，如果包含中文，直接输入中文即可。示例 obs url为https://test.obs.cn-north-4.myhuaweicloud

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件识别极速版接口 - 语音交互服务 SIS

表示在OBS对象桶名，使用前请先授权配置请参见配置OBS访问权限。obs_bucket_name字符长度区间为[3,64)，需要进行urlencode编码。 OBS桶区域需要与接口的地址区域一致。示例： obs url为https://sis-audio-cn4.obs.cn-north-4

帮助中心 > 语音交互服务 SIS > API参考
调用API实现一句话识别 - 语音交互服务 SIS

中的值。使用项目ID替换“{{cn4-project_id}}”值。可在我的凭证获取项目ID。单击“body”，复制音频的base64编码值到data参数中（配置文件中已填充示例音频）。单击“send”，发送请求，查看识别结果。

帮助中心 > 语音交互服务 SIS > 快速入门
实时语音识别 - 语音交互服务 SIS

private static final int DEFAULT_CONTINUE_SECONDS = 30; // 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； // 本示例以ak和sk保存在环

 帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
使用实时语音识别 - 语音交互服务 SIS

{ // 1. config parameter // 1.1 init authInfo // 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全; // 本示例以ak和

 帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）

总条数： 77

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

录音文件识别 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

API使用类 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

调用API或SDK - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

调用API实现一句话识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线