搜索_华为云

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

为什么会出现识别结果非常差的情况问题现象调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
返回状态正常，但识别结果为空 - 语音交互服务 SIS

返回状态正常，但识别结果为空一般由于格式不匹配造成的。请按照以下情况进行排查。 1. 请确保音频格式和请求格式参数保持一致，音频采样率和选择“property”参数中采样率保持一致。 2. 请确保音频位宽为16bit，目前仅支持16bit位宽的音频，如果低于该位宽的音频，则无法正常识别。

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
调用Java SDK实现一句话识别 - 语音交互服务 SIS

调用Java SDK实现一句话识别语音交互服务软件开发工具包（SIS SDK）是对语音交互服务提供的REST API进行的封装，用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的，以简化用户的开发工作。SIS SDK目前支持Java和Python。本章节提供了通过Java

帮助中心 > 语音交互服务 SIS > 快速入门
提交录音文件识别任务 - 语音交互服务 SIS

提交录音文件识别任务录音文件识别接口，用于识别长录音文件，支持中文普通话、四川话识别。录音文件放在OBS（对象存储服务）或公网可访问的服务器上。由于录音文件识别通常会需要较长的时间，因此识别是异步的，即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后

 帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

专有词汇和行业术语，进一步提高识别准确率。一句话识别可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据，系统经过处理，生成语音对应的文字，支持的语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。产品优势高识别率基于深度学习技术，对特定

 帮助中心 > 语音交互服务 SIS > 产品介绍
实时语音识别工作流程 - 语音交互服务 SIS

实时语音识别工作流程实时语音识别分为开始识别、发送音频数据、结束识别，断开连接四个阶段。开始阶段需要发送开始指令，包含采样率，音频格式，是否返回中间结果等配置信息。服务端会返回一个开始响应。发送音频阶段客户端会分片发送音频数据，服务会返回识别结果或者其他事件，如音频超时，静音部分过长等。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
开始识别 - 语音交互服务 SIS
开始识别 - 语音交互服务 SIS

开始识别功能介绍当wss握手请求收到成功响应后，客户端到服务端的通信协议会升级为Websocket协议。通过Websocket协议，客户端发送开始识别请求，用于配置实时语音识别的配置信息。请求消息表1 参数说明参数名是否必选参数类型说明 command 是 String

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
一句话识别Http接口 - 语音交互服务 SIS

一句话识别Http接口前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化A

帮助中心 > 语音交互服务 SIS > SDK参考 > Python SDK
使用实时语音识别 - 语音交互服务 SIS

使用实时语音识别前提条件确保已按照配置CPP环境（Windows）配置完毕。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化RasrClient，其参数包括AuthInfo。表1 AuthInfo 参数名称是否必选参数类型描述 ak

帮助中心 > 语音交互服务 SIS > SDK参考 > CPP SDK（Windows）
录音文件识别极速版接口 - 语音交互服务 SIS

录音文件识别极速版接口功能介绍录音文件识别极速版接口，用于录音文件的同步识别。音频需要上传华为云OBS，提供华为云OBS对象地址，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API

帮助中心 > 语音交互服务 SIS > API参考
获取录音文件识别结果 - 语音交互服务 SIS

获取录音文件识别结果功能介绍该接口用于获取录音文件识别结果及识别状态。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > 语音交互服务 SIS > API参考 > 录音文件识别接口
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成支持“华北-北京四”、“华东-上海一”区域。当前服务仅支持北京和上海区域，后续会陆续上线其他区域。华北-北京四，推荐的区域，支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。华东-上海一，推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 产品介绍 > 约束与限制
录音文件识别 - 语音交互服务 SIS

录音文件识别前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上（需保证可使用域名访问），示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上，确保服务已授权访问OBS，可参考配置OBS服务。请参考SDK（websocket）获取最新版本SDK包。

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
语音交互服务的区域如何选择 - 语音交互服务 SIS

语音交互服务的区域如何选择不同区域的资源之间内网不互通。为保证网络的连通性，降低网络时延、提高访问速度，请选择靠近您客户的区域，当前语音服务支持北京和上海区域，后续会陆续上线其他区域，当前支持的区域请参见地区与终端节点。华北-北京四，为推荐的区域，支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区
录音文件极速版 - 语音交互服务 SIS

录音文件极速版前提条件确保已按照配置Java环境配置完毕。确保已存在待识别的音频文件并上传OBS，示例音频可参考下载SDK压缩包文件，同时确保服务已授权访问OBS，可参考配置OBS服务。请参考SDK（websocket）获取最新版本SDK包。初始化Client 初始化F

帮助中心 > 语音交互服务 SIS > SDK参考 > Java SDK
http接口 - 语音交互服务 SIS
http接口 - 语音交互服务 SIS

http接口功能介绍一句话识别接口，用于短语音的同步识别。一次性上传1min以内音频，能快速返回识别结果。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面，用户无需编程即可使用服务功能。图1 在线使用

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。即时文本录入手机App上实时录音并即时提供转写的文本，例如语音输入法等。人机交互通过语音合成，实现高品质的机器人发声，使得人机交互更加自然。

帮助中心 > 语音交互服务 SIS > 产品介绍
SDK（websocket） - 语音交互服务 SIS

SDK（websocket）下载SDK包语音交互SDK软件包获取请参见表下载SDK包。示例音频参见示例音频。当您使用过旧版本的Java SDK时，需要注意旧版本的SDK依赖的jar包与新版本SDK的jar包有无冲突。新版本SDK升级日志为log4j2，同时java-sdk-core升级到3

帮助中心 > 语音交互服务 SIS > SDK参考
websocket接口 - 语音交互服务 SIS

websocket接口功能介绍一句话识别websocket接口支持识别1min以内的音频，交互过程如图客户端和服务端交互流程所示，主要分为开始识别、发送音频数据，结束识别、断开连接四个步骤。 websocket接口同http接口一致按次计费，只要建立连接成功，发送音频，服务

 帮助中心 > 语音交互服务 SIS > API参考 > 一句话识别
什么是区域与可用区 - 语音交互服务 SIS

如何选择区域？选择区域时，您需要考虑以下几个因素：地理位置一般情况下，建议就近选择靠近您或者您的目标用户的区域，这样可以减少网络时延，提高访问速度。不过，在基础设施、BGP网络品质、资源的操作与配置等方面，中国大陆各个区域间区别不大，如果您或者您的目标用户在中国大陆，可以不用考虑不同区域造成的网络时延问题。

帮助中心 > 语音交互服务 SIS > 常见问题 > 区域与可用区

总条数： 62

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么会出现识别结果非常差的情况 - 语音交互服务 SIS

返回状态正常，但识别结果为空 - 语音交互服务 SIS

调用Java SDK实现一句话识别 - 语音交互服务 SIS

提交录音文件识别任务 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

实时语音识别工作流程 - 语音交互服务 SIS

开始识别 - 语音交互服务 SIS

一句话识别Http接口 - 语音交互服务 SIS

使用实时语音识别 - 语音交互服务 SIS

录音文件识别极速版接口 - 语音交互服务 SIS

获取录音文件识别结果 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

录音文件识别 - 语音交互服务 SIS

语音交互服务的区域如何选择 - 语音交互服务 SIS

录音文件极速版 - 语音交互服务 SIS

http接口 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

websocket接口 - 语音交互服务 SIS

什么是区域与可用区 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线