搜索_华为云

websocket接口 - 语音交互服务 SIS

16k16bit单通道录音数据。 pcm8k16bit 8k16bit单通道录音数据。 ulaw16k8bit 16k8bit ulaw单通道录音数据。 ulaw8k8bit 8k8bit ulaw单通道录音数据。 alaw16k8bit 16k8bit alaw单通道录音数据。 alaw8k8bit

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
基本概念 - 语音交互服务 SIS
基本概念 - 语音交互服务 SIS

通常在调用API的鉴权过程中，您需要用到账号、用户和密码等信息。区域（Region）从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
录音文件识别多久可以返回结果 - 语音交互服务 SIS

录音文件识别多久可以返回结果音频转写时长受音频时长和排队任务数量影响，音频时长和理论返回时间可参见表音频转写时长参考表。如果转写耗时比理论时延长，大概率表示当前时间段出现转写高峰，请耐心等待，我们承诺最大转写时长不超过6小时。表1 音频转写时长参考表音频时长参考返回时间

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
计费说明 - 语音交互服务 SIS
计费说明 - 语音交互服务 SIS

计费说明计费项一句话识别、语音合成按调用次数计费；实时语音识别、录音文件识别按音频时长计费；录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费，时长计算精确到秒。按音频时长计费的，累加每次调用的音频时长。按调用次数计费的，返回失败的调用不计入次数。调用热词接口，不单独计费。

帮助中心 > 语音交互服务 SIS > 产品介绍
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
API概览 - 语音交互服务 SIS
API概览 - 语音交互服务 SIS

功能 API URI 一句话识别接口一句话识别 POST /v1/{project_id}/asr/short-audio 录音文件识别接录音文件识别接口识别接口：POST /v1/{project_id}/asr/transcriber/jobs 状态查询：GET /v1

帮助中心 > 语音交互服务 SIS > API参考
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

Boolen 是否取消返回识别结果。 true：表示取消识别，也即丢弃识别中和未识别的语音数据并结束，不返回剩余的识别结果。 false：表示继续处理识别中和未识别的语音数据直到处理完所有之前发送的数据。默认是false。示例 { "command": "END", "cancel":

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
一句话识别Websocket接口 - 语音交互服务 SIS

一句话识别Websocket接口前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。该功能为1.70及以上版本SDK新增功能，使用前请检查并更新SDK版本。请参考SDK（

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
实时语音识别 - 语音交互服务 SIS

实时语音识别前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient详见表

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
实时语音识别 - 语音交互服务 SIS

实时语音识别前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient，其参数包括AuthInfo、RasrListener、SisConfig。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
There was a bad response from the server报错 - 语音交互服务 SIS

There was a bad response from the server报错调用API时，出现There was a bad response from the server报错。表示无法正常连接到SIS服务。请先检查您的华为云账号是否已经进行了实名认证。如果您的网

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

见《API参考》中语音合成章节。 isSaved 否 Boolean 是否选择合成的音频数据保存到本地，默认不保存。 savePath 否 String 选择保存到本地的路径。路径需具体到文件，如D:/test.wav。响应参数响应类为TtsCustomResponse，详见表3。调用失败处理方法请参见错误码。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

16k16bit单通道录音数据。 pcm8k16bit 8k16bit单通道录音数据。 ulaw16k8bit 16k8bit ulaw单通道录音数据。 ulaw8k8bit 8k8bit ulaw单通道录音数据。 alaw16k8bit 16k8bit alaw单通道录音数据。 alaw8k8bit

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
一句话识别Http接口 - 语音交互服务 SIS

path = ""; // 音频文件路径，如D:/test.wav等，sdk会将音频文件转化为base64编码 private String pathAudioFormat = ""; // 文件格式，如wav等 private String pathProperty

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
获取AK/SK - 语音交互服务 SIS
获取AK/SK - 语音交互服务 SIS

找到原来已下载的AK/SK文件，文件名一般为：credentials.csv。如下图所示，文件包含了租户名（User Name），AK（Access Key Id），SK（Secret Access Key）。图1 credential.csv文件内容 AK/SK生成步骤：登录管理控制台。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
一句话识别Websocket接口 - 语音交互服务 SIS

一句话识别Websocket接口前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。该功能为1.70及以上版本SDK新增功能，使用前请检查并更新SDK版本。请参考SDK（websocket）获取最新版本SDK包。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读

总条数： 112

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

websocket接口 - 语音交互服务 SIS

基本概念 - 语音交互服务 SIS

录音文件识别多久可以返回结果 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

计费说明 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

API概览 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

实时语音识别 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

There was a bad response from the server报错 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

获取AK/SK - 语音交互服务 SIS

一句话识别Websocket接口 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线