搜索_华为云

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

TtsCustomRequest 参数名称是否必选参数类型描述 text 是 String 待合成的文本。 audio_format 否 String 待合成的音频格式，可选mp3，wav等，默认wav。具体信息请参见《API参考》语音合成章节。 pitch 否 Integer 音高，[-500,500]

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
录音文件识别 - 语音交互服务 SIS

region，如cn-north-4 """ todo 请正确填写音频格式和模型属性字符串 1. 音频格式一定要相匹配. 例如wav音频，格式是auto。具体参考api文档。例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
流式一句话 - 语音交互服务 SIS

最终结果的时间）即可返回最终识别结果。这种流式输入方式能缩短整体上获得最终结果的时间，极大地提升用户体验。 wss-URI wss-URI格式 wss /v1/{project_id}/rasr/short-stream 参数说明表1 参数说明参数名是否必选说明 project_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
计费说明 - 语音交互服务 SIS
计费说明 - 语音交互服务 SIS

购买的套餐包到期后如果没有购买新的套餐包，系统会自动转为按需计费。变更配置 SIS默认使用按需计费。您也可以根据您的实际情况购买资源包，购买后对应区域的资源将自动转为套餐包计费方式。如果超出当前已购买资源包的额度，超出部分将自动转为按需计费。欠费按需购买的接口是按照API调用次

 帮助中心 > 语音交互服务 SIS > 产品介绍
基本概念 - 语音交互服务 SIS
基本概念 - 语音交互服务 SIS

信息。区域（Region）从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云服务的Region；专属Regio

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
一句话识别 - 语音交互服务 SIS

一句话识别前提条件确保已经按照配置好iOS开发环境。已经保存好1分钟内音频文件，建议使用16k16bit进行录音并保存为wav格式。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SASRClient，参数为AuthInfo，详见表1。

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
开始语音合成请求 - 语音交互服务 SIS

Object 否配置信息。请参考表2。表2 config数据结构名称参数类型是否必选说明 audio_format String 否语音格式头：pcm、alaw、ulaw、mp3。默认：pcm sample_rate String 否采样率：16000、8000赫兹。默认：8000

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成请求
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

16k8bit alaw单通道录音数据。 alaw8k8bit 8k8bit alaw单通道录音数据。目前仅支持裸音频格式，仅支持pcm编码的wav格式，不支其他wav头或者arm格式的编码。示例 { "command": "START", "config": { "audio_format":

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
什么是区域与可用区 - 语音交互服务 SIS

资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用云服务的Region；专属Regio

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

alaw单通道录音数据。 mp3 mp3格式音频。目前仅支持单通道的音频。 aac aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式，从封装头中自动确定格式，目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k)

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值说明 auto 自动判断，系统会

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
APIG.0201报错 - 语音交互服务 SIS

检查上一个请求结果，上一个请求返回之后再发送下一个请求，避免请求过于频繁。请检查音频是否过大，或网络延时过长。如果音频过大，可利用mp3格式进行压缩；如果网络延时较长，可以适当提升网络传输速度。您可以直接使用SIS服务提供的SDK调用服务，避免出现该问题，SDK获取地址请参见获取SDK。

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
服务开通、关闭说明 - 语音交互服务 SIS

无法调用。您也可以在控制台购买套餐包，套餐包费用为一次性支付，支付成功后即刻生效或自定义指定时间生效。套餐包到期、套餐额度使用完，会自动转为按需计费。服务详细计费规格请参见价格计算器。

帮助中心 > 语音交互服务 SIS > 用户指南
如何查看当前接口是否免费调用 - 语音交互服务 SIS

购买的套餐包在生效期内，扣费方式是先扣除已购买的套餐包内的额度后，超出部分以按需计费的方式进行结算。购买的套餐包到期后如果没有购买新的套餐包，系统会自动转为按需计费。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

应用于课堂和学生自学，提升教学效率。直播实时字幕将视频直播或现场直播中的音频实时转为字幕，为观众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。即时文本录入手机App上实

 帮助中心 > 语音交互服务 SIS > 产品介绍

总条数： 74

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

计费说明 - 语音交互服务 SIS

基本概念 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

开始语音合成请求 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

APIG.0201报错 - 语音交互服务 SIS

服务开通、关闭说明 - 语音交互服务 SIS

如何查看当前接口是否免费调用 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线