搜索_华为云

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
录音文件识别接口 - 语音交互服务 SIS

录音文件识别接口提交录音文件识别任务获取录音文件识别结果

 帮助中心 > 语音交互服务 SIS > API参考
录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > 语音交互服务 SIS > API参考
录音文件识别 - 语音交互服务 SIS

存放录音文件地址：推荐使用华为云OBS：授权配置请参见OBS配置。您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。URL不能使用IP地址，只能使用域名，请尽量避免中文 audio_format 是 String 音频格式，具体信息请参见《API参考》中录音文件识别章节。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

存放录音文件地址：推荐使用华为云OBS：授权配置请参见OBS配置。您也可以把录音文件放在自行搭建服务器上，提供下载文件的地址。URL不能使用IP地址，只能使用域名，请尽量避免中文。 audioFormat 是 String 音频格式，具体信息请参见《API参考》中录音文件识别章节。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件识别 - 语音交互服务 SIS

录音文件识别支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
录音文件极速版 - 语音交互服务 SIS

录音文件极速版前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件并上传OBS，示例音频可参考下载SDK压缩包文件，同时确保服务已授权访问OBS，可参考配置OBS服务。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化F

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件极速版 - 语音交互服务 SIS

录音文件极速版前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化FlashLasrClient详见表

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
提交录音文件识别任务 - 语音交互服务 SIS

提交录音文件识别任务录音文件识别接口，用于识别长录音文件，支持中文普通话、四川话识别。录音文件放在OBS（对象存储服务）或公网可访问的服务器上。由于录音文件识别通常会需要较长的时间，因此识别是异步的，即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
获取录音文件识别结果 - 语音交互服务 SIS

获取录音文件识别结果功能介绍该接口用于获取录音文件识别结果及识别状态。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
录音文件识别极速版 - 语音交互服务 SIS

录音文件识别极速版支持“华北-北京四”、“华东-上海一”区域。当前语音服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域。华东-上海一，推荐的区域。支持wav、mp3、m4a、acc、opus格式音频文件。语音时长不超过120分钟，文件大小不超过100M。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。

帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
录音文件识别多久可以返回结果 - 语音交互服务 SIS

录音文件识别多久可以返回结果音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。表1 音频转写时长参考表音频时长参考返回时间

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音交互服务使用简介 - 语音交互服务 SIS

户通过实时访问和调用API获取语音交互结果。华为云SIS服务支持调用一句话识别、录音文件识别、实时语言识别、语音合成接口等。用户通过调用语音识别类接口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景

 帮助中心 > 语音交互服务 SIS > 快速入门
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
语音交互服务需要申请什么权限 - 语音交互服务 SIS

当用户需要使用录音文件识别功能时，需要用户具有主账号或者Security Administrator的权限。因为录音文件保存在用户的OBS（Object Storage Service，对象存储服务）桶中。考虑到数据的安全，语音交互服务无法直接获取到用户数据，需要用户授权录音文件引擎读取

 帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
获取AK/SK - 语音交互服务 SIS
获取AK/SK - 语音交互服务 SIS

找到原来已下载的AK/SK文件，文件名一般为：credentials.csv。如下图所示，文件包含了租户名（User Name），AK（Access Key Id），SK（Secret Access Key）。图1 credential.csv文件内容 AK/SK生成步骤：登录管理控制台。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
如何查看当前接口是否免费调用 - 语音交互服务 SIS

如何查看当前接口是否免费调用计费项一句话识别、语音合成按调用次数计费；实时语音识别、录音文件识别按音频时长计费；录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费，时长计算精确到秒。按音频时长计费的，累加每次调用的音频时长。按调用次数计费的，返回失败的调用不计入次数。

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类

总条数： 77

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

录音文件识别接口 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

获取录音文件识别结果 - 语音交互服务 SIS

录音文件识别极速版 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

录音文件识别多久可以返回结果 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

语音交互服务使用简介 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

语音交互服务需要申请什么权限 - 语音交互服务 SIS

获取AK/SK - 语音交互服务 SIS

如何查看当前接口是否免费调用 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线