检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是语音通话? 语音通话(Voice Call),以云服务的方式提供语音通信能力,支持语音回呼、语音验证码、语音通知。方便快捷,拨通率高;安全可靠,防盗取,防攻击;性能稳定,支持大容量、高并发。 了解语音通话功能请观看语音通话产品介绍视频 语音通话官网首页 父主题: 产品咨询类
实时语音识别响应 开始识别请求响应 事件响应 识别结果响应 错误响应 严重错误响应 结束识别请求响应 父主题: 实时语音识别接口
语音回呼API 语音回呼API使用说明 语音回呼场景API 终止呼叫场景API 语音回呼呼叫状态通知API 语音回呼话单通知API 获取录音文件下载地址API
实时语音识别 支持“华北-北京四”、“华东-上海一”区域。 当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
创建NLP大模型部署任务”。 本实践将使用华为云文本翻译API,请先完成创建多语言文本翻译插件操作。 操作流程 创建盘古多语言文本翻译工作流的流程见表1。 表1 创建盘古多语言文本翻译工作流流程 操作步骤 说明 步骤1:创建并配置多语言文本翻译工作流 本样例场景实现多语言文本翻译工作流的创建与配置。 步骤2:试运行多语言文本翻译工作流
语音合成 支持“华北-北京四”、“华东-上海一”区域。 当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
语音通话价格说明 计费概述 语音通话服务按照业务使用量,即账号所有固话号码数量(月租)和通话时长进行计费,具体可参考计费详情和计费原则。 语音通话采用预付费模式,使用语音通话服务前,需先在华为云账户中充值,可参考如何给账户充值。 计费详情 计费项 计费单位 价格 语音回呼服务费 元/分钟/路
在构建和运行多语言文本翻译工作流时,可能会遇到的常见典型问题如下: 问题一:文本翻译插件运行失败,报错信息如图1。 图1 文本翻译插件运行失败 可能原因:调用文本翻译API的Token错误或失效。 解决方法:参考创建多语言文本翻译插件,重新获取Token并进行试运行。 问题二:文本翻译失败,如
附录 创建多语言文本翻译插件 父主题: 低代码构建多语言文本翻译工作流
将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。 父主题: 产品咨询类
低代码构建多语言文本翻译工作流 方案设计 构建流程 效果评估与优化 典型问题 附录 父主题: Agent应用实践
实时语音识别接口 接口说明 Websocket握手请求 实时语音识别请求 实时语音识别响应
提问器节点:当意图识别为“文本翻译”意图时,工作流将进入提问器节点。该节点主要负责提问用户翻译需求(如翻译文本、目标语言等)。 文本翻译插件节点:在翻译意图分支中,文本翻译插件节点负责调用华为云文本翻译API,实现从源语言到目标语言的翻译过程。插件将翻译结果返回,传递给结束节点。
本实践的意图识别节点包含文本翻译意图和其他意图。 文本翻译意图:当用户请求翻译时,意图识别节点的关键任务是准确判断用户翻译的需求,执行翻译节点分支,并给出正确的翻译结果。 如图1,当用户输入翻译类问题时,“意图识别”节点对用户的意图分类为“文本翻译”,此时工作流将运行“提问器”
使用实时语音识别 前提条件 确保已按照配置CPP环境(Windows)配置完毕。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化RasrClient,其参数包括AuthInfo。 表1 AuthInfo 参数名称 是否必选 参数类型 描述 ak
语音合成 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 请参考SDK(websocket)获取最新版本SDK包。 初始化Client 初始化TtsCustomizationClient详见表 TtsCustomizationClient初始化参数。
如何开通语音质检? 新增应用:登录隐私保护通话控制台添加应用时,“是否开通录音”和“是否开通语音质检”都选择“是”即可开通。 已添加的应用:登录隐私保护通话控制台,点击“应用管理”,选择需要修改的应用,点击“操作”列下方的“修改”,“是否开通录音”和“是否开通语音质检”都选择“是”即可开通。
语音合成后输出的音频格式是什么 语音合成后返回一组Base64编码格式的语音数据,用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组,再保存为wav格式的音频。 语音合成(Text To Speech ,TTS服务)服务的音频格式则根据接口中audi
语音通知话单通知API 接口功能 用户通话结束后,语音通话平台通过此接口向SP推送通话的话单信息。短时间内有多个通话结束时语音通话平台会将话单合并推送,每条消息最多携带50个话单。 请求方向 语音通话平台(客户端) → 客户服务器(服务端) 使用说明 前提条件 SP在开发应用时,
添加语音模板 语音通话支持自定义语音模板,语音模板需要提前到语音通话平台提交并通过审核后才可使用。 进入语音通话控制台,点击“语音模板管理”。 点击右上角“添加语音模板”,开始添加。 填写模板名称、设置语音播放速度、模板内容及业务场景。 模板内容必须以汉字开头。 点击“确认”。