检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音机器人9大亮点 极速响应 不足1秒极速反馈,高度拟人音色,带来无限趋近于真人的聊天体验 不足1秒极速反馈,高度拟人音色,带来无限趋近于真人的聊天体验 机器人训练 根据已有对话内容,高效训练,自主学习,让机器人越用越聪明 根据已有对话内容,高效训练,自主学习,让机器人越用越聪明
Wav2Lip模型的输入为任意的一段视频和一段语音,输出为一段唇音同步的视频。 Wav2Lip的网络模型总体上分成三块:生成器、判别器和一个预训练好的唇音同步判别模型Pre-trained Lip-sync Expert。
语音通知话单通知API 接口功能 用户通话结束后,语音通话平台通过此接口向SP推送通话的话单信息。短时间内有多个通话结束时语音通话平台会将话单合并推送,每条消息最多携带50个话单。
实时语音识别 实时语音识别 实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。 实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。
KPI异常检测:https://res.hc-cdn.com/TrainService-CF-Product/1.0.28/hws/online-doc/template-notes/KPI.html KPI时序预测:https://res.hc-cdn.com/TrainService-CF-Product
删除训练作业 功能介绍 删除训练作业。 此接口为异步接口,作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI DELETE /v1/{project_id}/training-jobs/{job_id} 参数说明如表1所示。
语音合成后输出的音频格式是什么 语音合成后返回一组Base64编码格式的语音数据,用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组,再保存为wav格式的音频。
该API属于MetaStudio服务,描述: 查询语音训练任务详情接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}"
SP需要定制个性化放音文件,接口消息中携带此参数,请提前制作放音文件并通过放音文件管理页面提交到语音通话平台。 waitVoice 否 String(1-128) 无 此字段用于设置主叫应答语音回呼后的等待音,此值填写放音文件名,例如wait_voice1.wav。
训练作业调测 使用SDK调测单机训练作业 使用SDK调测多机分布式训练作业 父主题: 训练作业
停止训练作业版本 功能介绍 停止训练作业。 此接口为异步接口,作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。
处理方法 使用单标签分类的数据集进行训练。 父主题: 数据集问题导致训练失败
训练最后一个epoch卡死 问题现象 通过日志查看数据切分是否对齐,若未对齐,容易导致部分进程完成训练退出,而部分训练进程因未收到其他进程反馈卡死,如下图同一时间有的进程在epoch48,而有的进程在epoch49。 解决方案 对齐数据。 父主题: 训练作业卡死
train_instance_type 是 String 训练作业选择的资源规格,请参考查询资源规格列表 train_instance_count 是 int 训练作业计算节点个数。
智能语音助手 智能语音助手 智能语音助手可根据客户需求构建支持语音交互能力,且具备知识库、任务型对话、多轮对话、表格问答、自动文本生成、多模态等多种对话机器人能力的AI助手,赋能不同行业客户。
语音通话 VoiceCall 语音通话 VoiceCall 以云服务的方式提供语音通信能力,支持语音回呼、语音验证码、语音通知。方便快捷,拨通率高;安全可靠,防盗取,防攻击;性能稳定,支持大容量、高并发 以云服务的方式提供语音通信能力,支持语音回呼、语音验证码、语音通知。
查询训练作业日志 功能介绍 按行来查询训练作业日志详细信息。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions/{version_id}/aom-log 参数说明如表1所示。
job_id 是 String 训练作业的id,可通过创建训练作业生成的训练作业对象查询,如"job_instance.job_id",或从查询训练作业列表的响应中获得。
添加语音模板 语音通话支持自定义语音模板,语音模板需要提前到语音通话平台提交并通过审核后才可使用。 进入语音通话控制台,点击“语音模板管理”。 点击右上角“添加语音模板”,开始添加。 填写模板名称、设置语音播放速度、模板内容及业务场景。 模板内容必须以汉字开头。 点击“确认”。
最小值:1 pool_id String 训练作业选择的资源池ID。 flavor_detail flavor_detail object 训练作业、算法的规格信息。 表45 flavor_detail 参数 参数类型 描述 flavor_type String 资源规格的类型。