搜索_华为云

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成后能否返回播放时长不能，当前语音合成无此参数。若需要知道语音时长，可以将返回语音数据解码转换成音频格式，播放后查看。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

描述 data 否 String 语音数据，以Base64编码格式返回。用户如需生成音频，需要将Base64编码解码成byte数组，再保存为音频，音频格式同“audio_format”参数设置的值，默认为wav格式。语音合成代码示例请参考SDK，SDK已对Base64转音频过程进行封装，可以直接获取音频文件。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
语音交互服务使用简介 - 语音交互服务 SIS

音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。调用API接口需要具备一定的编程开发能力，返回的结果为JSON格式，用户需要通过编程来处理识别结果。您可以根据以下介绍选择合适的使用方式：

帮助中心 > 语音交互服务 SIS > 快速入门
什么是语音交互服务 - 语音交互服务 SIS

on、IOS等编程语言。用户通过调用API接口，将语音文件识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。首次使用SIS 如果您是首次使用SIS的用户，建议您学习并了解如下信息：功能介绍通过功能

 帮助中心 > 语音交互服务 SIS > 产品介绍
流式一句话 - 语音交互服务 SIS

最终结果的时间）即可返回最终识别结果。这种流式输入方式能缩短整体上获得最终结果的时间，极大地提升用户体验。 wss-URI wss-URI格式 wss /v1/{project_id}/rasr/short-stream 参数说明表1 参数说明参数名是否必选说明 project_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

可定制特定垂直领域的语言层模型，可识别更多专有词汇和行业术语，进一步提高识别准确率。一句话识别可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据，系统经过处理，生成语音对应的文字，支持的语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。产品优势

 帮助中心 > 语音交互服务 SIS > 产品介绍
在线调试 - 语音交互服务 SIS
在线调试 - 语音交互服务 SIS

在线调试 API Explorer在线调试工具提供API的检索、调试、代码示例生成功能。同时，集成开发环境CloudIDE，可完成代码的构建、调试、运行。本章节以语音合成为例，介绍如何使用API Explorer调试API。前提条件注册华为账号并开通华为云，并完成实名认证，

帮助中心 > 语音交互服务 SIS > 用户指南 > 调用API或SDK
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

16k8bit alaw单通道录音数据。 alaw8k8bit 8k8bit alaw单通道录音数据。目前仅支持裸音频格式，仅支持pcm编码的wav格式，不支其他wav头或者arm格式的编码。示例 { "command": "START", "config": { "audio_format":

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。如果检查参数“pro

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
什么是语音交互服务 - 语音交互服务 SIS

取语音交互结果。例如用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值说明 auto 自动判断，系统会

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

alaw单通道录音数据。 mp3 mp3格式音频。目前仅支持单通道的音频。 aac aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式，从封装头中自动确定格式，目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k)

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

将游戏娱乐中的语音聊天转成文字消息，提升用户阅读效率，提升用户体验。有声读物将书籍、杂志、新闻的文本内容转换成逼真的人声发音，充分解放人们的眼睛，在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。电话回访在客服系统场景中，通过将回访内容转换成人声，直接使用语音和客户交流，提升用户体验。智能教育集成语音合成

 帮助中心 > 语音交互服务 SIS > 产品介绍
什么是区域与可用区 - 语音交互服务 SIS

资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云服务的Region；专属Regio

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
APIG.0201报错 - 语音交互服务 SIS

timeout.","error_code":"APIG.0201"，表示请求超时。您可以尝试以下方案进行解决。使用Postman等工具直接调用服务，查看是否成功，如果调用成功表示服务接口没有问题，请执行如下步骤1和步骤2进行检查：请检查原调用请求是否过于频繁，如果是并发

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类

总条数： 78

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成后能否返回播放时长 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

在线调试 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

APIG.0201报错 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线