检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
实时语音识别连续模式 前提条件 确保已经按照配置好iOS开发环境。 初始化Client 初始化RASRClient,参数为AuthInfo和RASRConfig。 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak 是 String 用户的ak,可参考AK/SK认证。
录音文件识别极速版 支持“华北-北京四”、“华东-上海一”区域。 当前语音服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域。 华东-上海一,推荐的区域。 支持wav、mp3、m4a、acc、opus格式音频文件。 语音时长不超过120分钟,文件大小不超过100M。
实时语音识别连续模式 前提条件 确保已经按照配置好Android开发环境。 初始化Client 初始化RasrClient,其中参数包含AuthInfo,SisHttpCnfig,RasrResponseListener,RasrConnProcessListener 表1 RasrClient
修订记录 发布日期 修订说明 2023-09-27 新增: iOS SDK新增一句话识别、实时语音识别连续模式 2023-03-06 新增: CPP SDK支持Linux版本 2022-08-02 新增: Java SDK新增实时语音合成 Python SDK新增实时语音合成 CPP
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版
API使用类 如何查看接口调用量 为什么WebSocket一直连接不成功 为什么会出现识别结果非常差的情况 如何使用Websocket调用实时语音识别 有哪些途径可以使用语音交互的API 返回状态正常,但识别结果为空 Token消息体中user name,domain name和project
Android SDK 一句话识别(http版) 一句话识别(websocket版) 实时语音识别连续模式 语音合成(http版) 语音合成(webSocket版)
于录音文件转写需要较长的时间,因此转写是异步的。 表4 语音合成接口说明 接口类型 说明 语音合成/实时语音合成 语音合成,依托先进的语音技术,使用深度学习算法,将文本转换为自然流畅的语音。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自
接口说明 实时语音识别接口基于Websocket协议实现。分别提供了“流式一句话”、“实时语音识别连续模式”、“实时语音识别单句模式”三种模式。 三种模式的握手请求wss-URI不同,基于Websocket承载的实时语音识别请求和响应的消息格式相同。 开发者可以使用java、py
Java SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版
Python SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版
准备数据 数据要求 受技术与成本多种因素制约,SIS服务存在一些约束限制。详情请参考产品介绍中的约束与限制章节。
服务韧性 SIS提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务的可靠性。 父主题: 安全
iOS SDK 一句话识别 实时语音识别连续模式
调用API实现一句话识别 本章节提供了通过Postman调用一句话识别API的样例,详细介绍如何调用一句话识别API接口,帮助您快速熟悉语音交互服务的使用方法。调用SIS服务的具体操作如下: 步骤1:配置环境 步骤2:Token认证 步骤3:调用一句话识别 准备工作 注册华为帐号
CPP SDK(Windows) 使用实时语音识别 使用实时语音合成
CPP SDK(Linux) 使用实时语音识别 使用实时语音合成
http接口 功能介绍 一句话识别接口,用于短语音的同步识别。一次性上传1min以内音频,能快速返回识别结果。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了一句话识别的在线使用页面,用户无需编程即可使用服务功能。 图1 在线使用
安全 责任共担 身份认证与访问控制 数据保护技术 服务韧性 监控安全风险
权限类 语音交互服务需要申请什么权限 如何通过主账号创建一个子账号 语音识别是强制绑定使用OBS进行录音文件存储吗