搜索_华为云

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

format is invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值说明 auto 自动

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

如果设置为0，表示不检测“长时间静音”情况。取值范围：[0, 60000]的整数，单位为ms，默认为10000ms，即10s。 vad_tail 否 Integer 音频的结尾中的静音时间，正常情况下不应设成很小的值。如果检测语音结尾的静音时长大于等于此值时，在实时语音识别单句模式下将返回VO

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

alaw单通道录音数据。 mp3 mp3格式音频。目前仅支持单通道的音频。 aac aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式，从封装头中自动确定格式，目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k)

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
录音文件识别极速版 - 语音交互服务 SIS

支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。支持从华为云对象存储服务（OBS）

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
语音合成(http版) - 语音交互服务 SIS

根据需要配置是否跳过SSL证书验证 config.withIgnoreSSLVerification(true); 配置认证信息。配置AK、SK、project_id信息。华为云通过AK识别用户的身份，通过SK对请求数据进行签名验证，用于确保请求的机密性、完整性和请求者身份的正确性。使用永久AK和SK

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK
流式一句话 - 语音交互服务 SIS

账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。请求示例（伪码）

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
获取账号ID - 语音交互服务 SIS
获取账号ID - 语音交互服务 SIS

获取账号ID 在调用接口的时候，部分URL中需要填入账号ID（domain-id），所以需要先在管理控制台上获取到账号ID。账号ID获取步骤如下：注册并登录管理控制台。在控制台中，鼠标移动至右上角的用户名处，在下拉列表中选择“我的凭证”。图1 我的凭证入口在“我的凭证”页面的项目列表中查看账号ID。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
调用语音交互的API显示auth failed - 语音交互服务 SIS

Console均可以查到）。检查获取Token是否正常。确保获取Token为24小时之内的Token。确保获取Token的参数嵌套是否正确。正确的嵌套应该如下列代码示例所示，错误的嵌套也能获取Token，但无法访问服务。使用AK/SK方式访问，检查AK和SK是否填写正确。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
开始语音合成请求 - 语音交互服务 SIS

人支持长度不大于10000字符的文本，其他发音人支持长度不大于500字符的文本。 config Object 否配置信息。请参考表2。表2 config数据结构名称参数类型是否必选说明 audio_format String 否语音格式头：pcm、alaw、ulaw、mp3。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

TtsCustomRequest 参数名称是否必选参数类型描述 text 是 String 待合成的文本。 audio_format 否 String 待合成的音频格式，可选mp3，wav等，默认wav。具体信息请参见《API参考》语音合成章节。 pitch 否 Integer

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
调用说明 - 语音交互服务 SIS
调用说明 - 语音交互服务 SIS

议，调用方法请参见如何调用WebSocket API。调用所需示例音频参见示例音频。调用接口的时候，无需开通服务，可直接调用。此时请按照实际需要选择计费方式，计费是按照调用接口的次数或者时长来计算费用，具体计费价格参见语音交互价格计算器。支持两种计费方式：按需计费，默认计费方式为“按需计费”。

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

模式”、“实时语音识别单句模式”三种模式。三种模式的握手请求wss-URI不同，基于Websocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、python、c++等开发语言支持Websocket的对应软件包或库接口，与实时语音识别引擎握手连接，并发

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
语音交互服务使用简介 - 语音交互服务 SIS

音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。调用API接口需要具备一定的编程开发能力，返回的结果为JSON格式，用户需要通过编程来处理识别结果。

帮助中心 > 语音交互服务 SIS > 快速入门

总条数： 168

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

语音合成(http版) - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

获取账号ID - 语音交互服务 SIS

调用语音交互的API显示auth failed - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

调用说明 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线