搜索_华为云

什么是区域与可用区 - 语音交互服务 SIS

区域。云服务之间的关系如果多个云服务一起搭配使用，需要注意：不同区域的弹性云服务器、关系型数据库、对象存储服务内网不互通。不同区域的弹性云服务器不支持跨区域部署在同一负载均衡器下。资源的价格不同区域的资源价格可能有差异，请参见华为云服务价格详情。如何选择可用区是否

 帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
时间戳数据 - 语音交互服务 SIS

时间戳数据功能介绍实时语音合成服务在生成音频流的同时，可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。参数设置设置请求参数subtitle为"word_level"或"phoneme_level"时，开启时间戳功能。响应信息表1 响应参数

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
准备数据 - 语音交互服务 SIS
准备数据 - 语音交互服务 SIS

准备数据数据要求受技术与成本多种因素制约，SIS服务存在一些约束限制。详情请参考产品介绍中的约束与限制章节。

帮助中心 > 语音交互服务 SIS > 用户指南
发送音频数据 - 语音交互服务 SIS

发送音频数据在收到“开始识别”的响应之后，可以开始发送音频数据。为节省流量，音频以二进制数据帧形式（binary message）的方式发送。音频数据将分片发送，也即在获得一定量音频数据的同时就可以发送一个binary message，每个分片建议在50ms~1000ms之间

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
数据保护技术 - 语音交互服务 SIS

数据保护技术在使用语音交互服务过程中委托我们处理的语音音频和文本等数据，您完全拥有上述数据所有权及控制权，您应自行对上述数据来源和获取的合法性负责，华为云受托处理您的数据，以实现本服务功能或目的：（1）将语音音频数据识别转换成文本。（2）将文本数据合成语音。您的上述数据将

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
音频流数据 - 语音交互服务 SIS

音频流数据功能介绍分多段返回二进制语音数据流，如果用户未设置语音格式，则默认返回pcm格式语音。父主题：语音合成结果响应

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音合成接口 > 实时语音合成响应 > 语音合成结果响应
流式一句话 - 语音交互服务 SIS

果。实时语音识别引擎在获得分段的输入语音的同时，就可以同步地对这段数据进行特征提取和解码工作，而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后，仅延迟很短的时间（也即等待处理最后一段语音数据以及获取最终结果的时间）即可返回最终识别结果。这种流式输入方式能缩

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
语音交互服务的区域如何选择 - 语音交互服务 SIS

语音交互服务的区域如何选择不同区域的资源之间内网不互通。为保证网络的连通性，降低网络时延、提高访问速度，请选择靠近您客户的区域，当前语音服务支持北京和上海区域，后续会陆续上线其他区域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
配置OBS访问权限 - 语音交互服务 SIS

在OBS“桶列表”页，单击创建的OBS桶。图2 进入OBS桶进入“对象”页面，将音频数据上传至OBS桶中。图3 上传视频数据获取音频URL 单击已上传的数据名称，进入数据详情页。图4 进入数据详情页复制链接，获取数据URL。图5 获取数据URL 父主题：附录

 帮助中心 > 语音交互服务 SIS > API参考 > 附录
websocket接口 - 语音交互服务 SIS

16k16bit单通道录音数据。 pcm8k16bit 8k16bit单通道录音数据。 ulaw16k8bit 16k8bit ulaw单通道录音数据。 ulaw8k8bit 8k8bit ulaw单通道录音数据。 alaw16k8bit 16k8bit alaw单通道录音数据。 alaw8k8bit

帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

_format参数格式要保证一致。一句话识别支持的音频格式详见表1。表1 audio_format取值范围 audio_format取值说明 pcm16k16bit 16k16bit单通道录音数据。 pcm8k16bit 8k16bit单通道录音数据。 ulaw16k8bit

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
实时语音识别连续模式 - 语音交互服务 SIS

连续识别模式在流式识别的基础上，结合了语音的端点检测功能。语音数据也是分段输入，但是连续识别模式将会在处理数据之前进行端点检测，如果是语音才会进行实际的解码工作，如果检测到静音，将直接丢弃。如果检测到一段语音的结束点，就会直接将当前这一段的识别结果返回，然后继续检测后面的语音数据。因此在连续识别模式中，可能多次

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
提交录音文件识别任务 - 语音交互服务 SIS

16k16bit裸音频录音数据。 pcm8k16bit 8k16bit裸音频录音数据。 ulaw16k8bit 16k8bit ulaw 裸音频录音数据。 ulaw8k8bit 8k8bit ulaw 裸音频录音数据。 alaw16k8bit 16k8bit alaw 裸音频录音数据。 alaw8k8bit

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

16k16bit裸音频录音数据。 pcm8k16bit 8k16bit裸音频录音数据。 ulaw16k8bit 16k8bit ulaw 裸音频录音数据。 ulaw8k8bit 8k8bit ulaw 裸音频录音数据。 alaw16k8bit 16k8bit alaw 裸音频录音数据。 alaw8k8bit

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
录音文件识别极速版接口 - 语音交互服务 SIS

“no”。 first_channel_only 否 String 表示是否在识别中只识别首个声道的音频数据，取值为“yes”和“no”，默认为“no”。说明：如果音频数据为多声道，参数取默认值no时，会叠加计费。例如，双声道收费为双倍。表4 audio_format取值范围

 帮助中心 > 语音交互服务 SIS > API参考
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

请检查请求体中的json是否正确。确保设置的audio_format格式的值是合法，待识别的音频格式和audio_format参数格式要保证一致。对于录音文件识别接口，如果不确定该参数取值，可改为auto进行调试。使用实时语音识别时请确认是否分片发送音频，并在wss握手后发送start命令。

帮助中心 > 语音交互服务 SIS > API参考 > 附录

总条数： 71

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是区域与可用区 - 语音交互服务 SIS

时间戳数据 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

准备数据 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

数据保护技术 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

音频流数据 - 语音交互服务 SIS

流式一句话 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线