检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音合成错误响应 功能介绍 合成引擎处理合成请求时如果发生错误则返回该响应。 响应消息 表1 响应参数 名称 参数类型 说明 resp_type String 响应类型。参数值为ERROR,表示错误响应。 trace_id String 服务内部的令牌,可用于在日志中追溯具体流程。
语音模板中的变量是如何填充的? 在语音通话控制台添加语音模板,并在调用语音通知API时携带模板ID(templateId)和变量值列表(templateParas),系统会自动将模板内容通过TTS服务转换成语音,向用户播放。 父主题: 放音文件及语音模板配置
时间戳数据 功能介绍 实时语音合成服务在生成音频流的同时,可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。 参数设置 设置请求参数subtitle为"word_level"或"phoneme_level"时,开启时间戳功能。 响应信息 表1 响应参数
语音合成 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化TtsCustomizationClient详见表 TtsCustomizationClient初始化参数。
添加应用 语音通话应用是用户使用华为云语音通话服务的载体。请根据您所开展的业务,填写应用信息: 语音通话服务默认可添加5个应用。 应用添加成功后将无法删除且无法修改“业务类型”。 请登录并进入语音通话控制台。 进入“应用管理”页面,点击“添加应用”。 按照页面提示填写应用信息。
方案概述 应用场景 该解决方案是华为云语音交互服务SIS基于FunctionGraph开发的一套客服中心语音质检工作流。帮助您迈出传统行业向数字化转型的第一步,使用智能语音交互提高客服中心语音质检覆盖率和效率。适用于以下需求场景: 电商领域客服服务过程异常检测; 电销领域违规、投诉、专项检测;
语音验证码话单通知API 接口功能 用户通话结束后,语音通话平台通过此接口向SP推送通话的话单信息。短时间内有多个通话结束时语音通话平台会将话单合并推送,每条消息最多携带50个话单。 请求方向 语音通话平台(客户端) → 客户服务器(服务端) 使用说明 前提条件 SP在开发应用时
实时语音合成响应 开始合成响应 语音合成结果响应 语音合成结束响应 语音合成错误响应 严重错误响应 父主题: 实时语音合成接口
提供“自动学习白盒化”能力,开放模型参数、自动生成模型,实现模板化开发,提高开发效率 采用自动深度学习技术,通过迁移学习(只通过少量数据生成高质量的模型),多维度下的模型架构自动设计(神经网络搜索和自适应模型调优),和更快、更准的训练参数自动调优自动训练 采用自动机器学习技术,基于
语音合成后输出的音频格式是什么 语音合成后返回一组Base64编码格式的语音数据,用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组,再保存为wav格式的音频。 语音合成(Text To Speech ,TTS服务)服务的音频格式则根据接口中audi
实时语音识别连续模式 功能介绍 连续识别模式的语音总长度限制为五小时,适合于会议、演讲和直播等场景。 连续识别模式在流式识别的基础上,结合了语音的端点检测功能。语音数据也是分段输入,但是连续识别模式将会在处理数据之前进行端点检测,如果是语音才会进行实际的解码工作,如果检测到静音,
语音回呼API使用说明 API列表 API名称 API功能 语音回呼场景API 主叫用户通过应用拨打被叫用户,语音通话平台呼叫主叫和被叫,使主叫和被叫能够互相通话。 终止呼叫场景API 实现通话双方终止呼叫。 语音回呼呼叫状态通知API 语音通话平台向SP推送接收语音通话业务用户
语音模板内容支持小数吗? ${TXT_数字}支持小数。 ${TXT_数字}:表示变量为定义相应长度的字符串,数字表示该字符串的最大长度,如${TXT_9}表示最大长度为9的字符串。 父主题: 放音文件及语音模板配置
访问URI 开发者应用接收呼叫状态URL 通信协议 HTTPS/HTTP 请求参数 SP调用语音验证码API,语音通话平台发起呼叫,给用户播放语音验证码。 注:以下流程以语音通话平台呼叫A,给A播放语音验证码为例。流程和接口示例仅供参考,请以实际消息为准。 表2 请求Headers参数说明
实时语音合成请求 开始语音合成请求 父主题: 实时语音合成接口
通用文字识别 功能介绍 识别图片上的文字信息,以JSON格式返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 支持中英文以及部分繁体字。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 通用文字示例图 约束与限制
如何查看语音模板内容?是否支持下载或迁移? 已添加成功的语音模板内容可在语音模板管理页面查看。 不支持下载。不支持华为云账号之间的迁移,同一个语音模板可供同一个华为云账号下的不同应用使用。 父主题: 放音文件及语音模板配置
业务公司服务器成功登录语音通话平台。 业务公司服务器发起语音通知请求,请求语音通话平台向Jane播放业务公司定制的欠费通知。 业务公司服务器调用“语音通知API”实现整个呼叫过程。 语音通话平台呼叫Jane。 Jane接听。 语音通话平台向Jane播放业务公司定制的欠费通知。 J
在流式一句话模式下: 不会返回VOICE_START、VOICE_END、EXCEEDED_SILCENCE事件。 在实时语音识别单句模式下: 返回VOICE_START事件,表示检测到语音,此时IVR可以做打断。 返回VOICE_END事件后,表示一句话结束,后续的音频将被忽略,不会再进行识别。
实时语音识别请求 实时语音识别工作流程 开始识别 发送音频数据 结束识别 父主题: 实时语音识别接口