搜索_华为云

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

16k8bit alaw单通道录音数据。 alaw8k8bit 8k8bit alaw单通道录音数据。目前仅支持裸音频格式，仅支持pcm编码的wav格式，不支其他wav头或者arm格式的编码。示例 { "command": "START", "config": { "audio_format":

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

import ServerException import json # 鉴权参数 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

region，如cn-north-4 """ todo 请正确填写音频格式和模型属性字符串 1. 音频格式一定要相匹配. 例如wav音频，格式是auto。具体参考api文档。例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

todo 请正确填写音频格式和模型属性字符串 * 1. 音频格式一定要相匹配。 * 例如obs url是xx.wav, 则在录音文件识别格式是auto。 * 例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
录音文件极速版 - 语音交互服务 SIS

表4 audio_format取值范围 audio_format取值描述 wav wav格式音频 mp3 mp3格式音频 m4a m4a格式音频 aac aac格式音频 opus ops格式音频。表5 property取值范围 property取值描述 chinese_8k_common

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
什么是语音交互服务 - 语音交互服务 SIS

on、IOS等编程语言。用户通过调用API接口，将语音文件识别成可编辑的文本，然后返回JSON格式的识别结果，用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。首次使用SIS 如果您是首次使用SIS的用户，建议您学习并了解如下信息：功能介绍通过功能

 帮助中心 > 语音交互服务 SIS > 产品介绍
概述 - 语音交互服务 SIS
概述 - 语音交互服务 SIS

Service，简称SIS）是一种人机交互方式，用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。音频发送结束后，客户端会发送结束请求，服务端会返回end响应。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

0535 录音文件识请求的文件类型不支持。确保设置的audio_format格式的值是合法。录音文件识别支持的音频格式如表7所示。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。 SIS.0536 录音文件识任务提交数量达到限制。请稍后重试。 SIS

帮助中心 > 语音交互服务 SIS > API参考 > 附录
流式一句话 - 语音交互服务 SIS

最终结果的时间）即可返回最终识别结果。这种流式输入方式能缩短整体上获得最终结果的时间，极大地提升用户体验。 wss-URI wss-URI格式 wss /v1/{project_id}/rasr/short-stream 参数说明表1 参数说明参数名是否必选说明 project_id

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
一句话识别Http接口 - 语音交互服务 SIS

region，如cn-north-4 """ todo 请正确填写音频格式和模型属性字符串 1. 音频格式一定要相匹配。例如wav音频，格式是wav。具体参考api文档。例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
websocket接口 - 语音交互服务 SIS

16k8bit alaw单通道录音数据。 alaw8k8bit 8k8bit alaw单通道录音数据。目前仅支持裸音频格式，仅支持pcm编码的wav格式，不支其他wav头或者arm格式的编码。示例 { "command": "START", "config": { "audio_format":

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
一句话识别 - 语音交互服务 SIS

一句话识别前提条件确保已经按照配置好iOS开发环境。已经保存好1分钟内音频文件，建议使用16k16bit进行录音并保存为wav格式。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化SASRClient，参数为AuthInfo，详见表1。

帮助中心 > 语音交互服务 SIS > SDK参考 > iOS SDK
调用说明 - 语音交互服务 SIS
调用说明 - 语音交互服务 SIS

API。调用所需示例音频参见示例音频。调用接口的时候，无需开通服务，可直接调用。此时请按照实际需要选择计费方式，计费是按照调用接口的次数或者时长来计算费用，具体计费价格参见语音交互价格计算器。支持两种计费方式：按需计费，默认计费方式为“按需计费”。折扣套餐包方式，是用户可

 帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
什么是区域与可用区 - 语音交互服务 SIS

选择区域时，您需要考虑以下几个因素：地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。不过，在基础设施、BGP网络品质、资源的操作与配置等方面，中国大陆各个区域间区别不大，如果您或者您的目标用户在中国大陆，可以不用考虑不同区域造成的网络时延问题。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
热词管理 - 语音交互服务 SIS
热词管理 - 语音交互服务 SIS

SisConfig import json import os # 鉴权参数 # 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全； # 本示例以ak和sk保存在环境变量中来实现身份验证为例，运行本示例前

 帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK

总条数： 88

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

什么是语音交互服务 - 语音交互服务 SIS

概述 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

一句话识别 - 语音交互服务 SIS

调用说明 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

热词管理 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线