搜索_华为云

语音交互服务使用简介 - 语音交互服务 SIS

口，将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本，同时也支持通过调用语音合成接口将文本转换成逼真的语音等。适用场景有语音客服质检、会议记录、语音短消息、有声读物、电话回访等。调用API接口需要具备一定的编程开发能力，返回的结果为JSON格式，用户需要通过编程来处理识别结果。

帮助中心 > 语音交互服务 SIS > 快速入门
SIS.0304报错 - 语音交互服务 SIS
SIS.0304报错 - 语音交互服务 SIS

检查代码是否存在发送音频后睡眠过多时间。 2. 检查是否发送end请求，是否关闭客户端。超过20s没有发送数据同时也没有断开连接，就会报该错误。在使用完毕后一定要记得断开与服务端连接。父主题：错误码类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
语音交互服务的区域如何选择 - 语音交互服务 SIS

语音交互服务的区域如何选择不同区域的资源之间内网不互通。为保证网络的连通性，降低网络时延、提高访问速度，请选择靠近您客户的区域，当前语音服务支持北京和上海区域，后续会陆续上线其他区域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果每个用户独立建立websocket连接，不可共用一个websocket连接。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
使用HTML5 Websocket API发送websocket请求如何携带token - 语音交互服务 SIS

Websocket API发送websocket请求如何携带token 浏览器 WebSocket API 是 HTML5 提供的一种在 TCP 连接上进行全双工通讯协议的 API, 但 WebSocket API 不支持设置 Headers，如需设置 Headers, 建议通过 Nginx

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成后输出的音频格式是什么 - 语音交互服务 SIS

语音合成后输出的音频格式是什么语音合成后返回一组Base64编码格式的语音数据，用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组，再保存为wav格式的音频。语音合成（Text To Speech ，TTS服务）服务的音频格式则根据接口中audi

帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成的base64编码如何使用 - 语音交互服务 SIS

语音合成的base64编码如何使用问题现象用户在使用语音合成获取响应体的base64编码，不了解应该如何进一步使用。解决方案 1. 建议用户使用Java或Python SDK，可参考SDK简介。 2. 使用html网页播放，新建一个html文件，如下填写内容，即可在浏览器播放。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 产品咨询类
录音文件识别极速版接口 - 语音交互服务 SIS

wav。如果上传至OBS桶中的文件或OBS路径为中文，obs_object_key的值需要采用中文形式。 obs_object_key 是 String 表示OBS对象桶中的对象的键值，长度小于1024个字符，需要进行urlencode编码。 OBS桶区域需要与接口的地址区域一致。示例：

帮助中心 > 语音交互服务 SIS > API参考
有哪些途径可以使用语音交互的API - 语音交互服务 SIS

有哪些途径可以使用语音交互的API 共有三种方式可以基于已构建好的请求消息发起请求。 cURL cURL是一个命令行工具，用来执行各种URL操作和信息传输。cURL充当的是HTTP客户端，可以发送HTTP请求给服务端，并接收响应消息。cURL适用于接口调试。关于cURL详细信息请参见https://curl

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频语音合成接口当前仅支持单声道，不支持返回立体音（双声道）格式的音频。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

GET：请求服务器返回指定资源。 PUT：请求服务器更新指定资源。 POST：请求服务器新增资源或执行特殊操作。 DELETE：请求服务器删除指定资源，如删除对象等。 HEAD：请求服务器资源头部。 PATCH：请求服务器更新资源的部分内容。当资源不存在的时候，PATCH可能会去创建一个新的资源。

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
如何查看实时语音识别的中间结果 - 语音交互服务 SIS

如何查看实时语音识别的中间结果实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。在使用API或SDK时，可以通过将interim_results参数设置为yes，将识别过程的中间结果返回。如果设置为no，则会等每句话完毕才会返回识别结果。详细参数说明请见实时语音识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
终端节点 - 语音交互服务 SIS
终端节点 - 语音交互服务 SIS

终端节点终端节点即调用API的请求地址，不同服务不同区域的终端节点不同。目前语音交互服务一句话识别、录音文件识别支持以下地区和终端节点：当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > API参考 > 使用前必读
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

TtsCustomizationClient初始化参数参数名称是否必选参数类型描述 ak 是 String 用户的ak，可参考AK/SK认证。 sk 是 String 用户的sk，可参考AK/SK认证。 region 是 String 区域，如：cn-north-4。具体请参考终端节点。

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
录音文件识别 - 语音交互服务 SIS

ogg-opus、AMR等多种格式，详见API参考文档中的“audio_format取值范围”。语音时长不超过5小时，文件大小不超过300M，用户的识别任务在6小时内完成并返回识别结果，识别结果保存72小时（从转写完成的时间算起）。支持中文普通话、四川话识别。父主题：约束与限制

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
公共请求参数 - 语音交互服务 SIS

Sec-WebSocket-Key 发送WebSocket握手请求时，包含该头域。采用Base64编码的随机16字节长的字符序列。用来发送给服务器使用，服务器会使用此字段组装成另一个key值放在握手返回信息里发送客户端。 x3JJHMbDL1EzLkh9GBhXDw== Sec-WebSocket-Version

帮助中心 > 语音交互服务 SIS > API参考 > 附录
如何调用WebSocket API - 语音交互服务 SIS

关闭WebSocket连接。其中，基于WebSocket协议进行实时语音识别时，需要客户端首先发送转写开始消息，然后持续发送语音数据至服务端，最后发送结束消息，在此期间客户端会持续收到服务端发送的转写结果或事件，客户端根据所收到的响应消息做对应处理。实时语音识别接口的具体细节请参见接口说明章节。

帮助中心 > 语音交互服务 SIS > API参考
语音合成(webSocket版) - 语音交互服务 SIS

t(); webSocket建立连接后后调。 void onTranscriptionClose(); webSocket连接关闭后回调。 void onTranscriptionFail(RttsResponse response); 长连接连接失败是回调。 void onTr

帮助中心 > 语音交互服务 SIS > SDK参考 > Android SDK

总条数： 137

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音交互服务使用简介 - 语音交互服务 SIS

SIS.0304报错 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

实时语音识别多人同时使用，如何区分各自识别结果 - 语音交互服务 SIS

使用HTML5 Websocket API发送websocket请求如何携带token - 语音交互服务 SIS

语音合成后输出的音频格式是什么 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

语音合成的base64编码如何使用 - 语音交互服务 SIS

是否支持aac格式的语音文件转文字 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

有哪些途径可以使用语音交互的API - 语音交互服务 SIS

语音合成能不能支持返回立体音（双声道）格式的音频 - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

如何查看实时语音识别的中间结果 - 语音交互服务 SIS

终端节点 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

公共请求参数 - 语音交互服务 SIS

如何调用WebSocket API - 语音交互服务 SIS

语音合成(webSocket版) - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线