检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
准备工作 该解决方案部署,需要开通、配置以下授权。 购买、配置语音交互服务录音文件识别 登录语音交互服务,选择录音文件识别,单击购买录音识别套餐包。 图1 登录语音交互服务 图2 购买录音套餐 选择服务授权,开通对象服务授权。 图3 开通对象服务授权 创建rf_amdin_trust委托
语音合成 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化TtsCustomizationClient详见表 TtsCustomizationClient初始化参数。
UD_SDK_AK和HUAWEICLOUD_SDK_SK String ak = System.getenv("HUAWEICLOUD_SDK_AK"); String sk = System.getenv("HUAWEICLOUD_SDK_SK");
请求参数 无 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
101" } 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
icloud-sdk-ocr”。请在SDK中心获取最新的sdk包版本,替换代码中版本。 <dependency> <groupId>com.huaweicloud.sdk</groupId> <artifactId>huaweicloud-sdk-core</artifactId>
Websocket握手请求 流式一句话 实时语音识别连续模式 实时语音识别单句模式 父主题: 实时语音识别接口
"801166010768953344" } 响应参数 { "message": "success", "retcode": "0" } 父主题: 订阅语音识别结果接口
准备工作 语音交互服务开通授权 登录语音交互服务,在控制台左上角选择区域为“北京四”,左侧菜单选择服务授权,打开对象存储服务授权。如之前已打开过授权,如图1,则无需操作。 图1 打开对象存储服务授权 创建rf_amdin_trust委托 登录华为云控制台,打开“统一身份认证”菜单。
确保已按照配置Java环境配置完毕。 确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上(需保证可使用域名访问),示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上,确保服务已授权访问OBS,可参考配置OBS服务。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client
确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 确保已存在待识别的音频文件并上传OBS或者有公网可访问服务器上(需保证可使用域名访问),示例音频可参考下载SDK压缩包文件。如果音频存放在OBS上,确保服务已授权访问OBS,可参考配置OBS服务。 请参考SDK(websocket)获取最新版本SDK包。
image size does not meet the requirements." } SDK代码示例 SDK代码示例如下。 使用SDK前建议将SDK更新至最新版,防止本地旧版SDK无法使用最新的OCR功能。 Java Python Go 更多 传入身份证图片的base64编
String(1-128) 无 通知语音的放音文件名。需要先通过放音文件管理页面上传放音文件并通过审核才能使用。 当前系统只支持Wave格式的音频文件,文件如“notifyvoice.wav”。 该参数和templateId是二选一的关系,即两个参数必须携带其中一个。 templateId
是否支持aac格式的语音文件转文字 一句话识别和录音文件识别以及实时语音识别均可实现语音转文字,一句话识别支持aac格式,录音文件识别和实时语音识别不支持aac格式。 父主题: 产品咨询类
29:全屏质检 30:同组代答 31:已废弃 32:配置业务代表 33:配置技能 34:不可填写外呼主叫 35:配置审计 父主题: 订阅语音识别结果接口
错误码定义 CC-Gateway返回结果码 订阅语音识别结果接口通用返回结果码 CTI返回通用错误码 CTI返回VDN配置接口错误码 CTI返回系统配置接口错误码 UAP返回错误码 父主题: 订阅语音识别结果接口
下载SDK包下载SDK使用,当前支持Java SDK、Python SDK、CPP SDK。后序章节均指代该SDK,使用方法可参考Java SDK、Python SDK、CPP SDK(Windows)、CPP SDK(Linux)。当前自研SDK仅java和python提供企业
语音数据,以Base64编码格式返回。 用户如需生成音频,需要将Base64编码解码成byte数组,再保存为音频,音频格式同“audio_format”参数设置的值,默认为wav格式。 语音合成代码示例请参考SDK,SDK已对Base64转音频过程进行封装,可以直接获取音频文件。 状态码: 400 表9
我们针对不同语言的SDK提供了开发指南: 表1 不同语言SDK的开发指南 编程语言 开发指南 Java Java SDK 开发指南 Python Python SDK 开发指南 Node.js Node.js SDK 开发指南 PHP PHP SDK 开发指南 C++ C++ SDK 开发指南
ByteString; import java.net.URL; /** * 此demo仅供测试使用,强烈建议使用SDK * 使用前需已配置okhttp、okio jar包。jar包可通过下载SDK获取。 */ public class RasrDemo { public void rasrDemo()