检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练阶段输入预先获取的高质量语音及其表情基系数,通过学习获得语音特征与表情基系数的关系。 用户使用时,输入音频流或音频文件。 音频经过安全审核后,进入下一步操作,否则不返回结果。 对音频特征提取后,获取音频特征,再通过算法将音频特征转换为表情基系数。 返回结果数据。 算法应用场景 数字人语音驱动算法可用于短
Array of errors objects 错误列表。 表4 errors 参数 参数类型 描述 audio_name String 音频文件名。 text_name String 文本文件名。 error_code String 异常错误码。 error_message String
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 robot_id 是 String 应用ID。 sis_hot_words 是 CreateSisHotWords
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 sis_hot_words 是 UpdateSisHotWords object sis类型热词 表4 UpdateSisHotWords
语音合成管理 创建TTS试听任务 获取TTS试听文件
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
获取语音驱动任务列表 功能介绍 该接口用于查询驱动数字人表情、动作及语音的任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsa-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
获取语音驱动表情数据 功能介绍 该接口用于获取生成的数字人表情驱动数据 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/fas-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID
删除语音训练任务 功能介绍 删除语音训练任务 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 确认在线录音结果 获取在线录音确认结果
提交语音训练任务 功能介绍 提交训练任务,执行该接口后,任务会进入审核状态,审核完成后会等待训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数
20020032 生成临时试听音频失败 生成临时试听音频失败 重新生成临时试听音频 400 MSS.20020033 资产不存在样例音频 资产不存在样例音频 请联系管理员确认 400 MSS.20020034 根据标注信息切割音频失败 根据标注信息切割音频失败 请联系管理员确认 400
查询语音训练任务详情 功能介绍 查询语音训练任务详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
示例3:语音合成管理 语音合成管理示例代码,请参考MetaStudio数字人语音合成管理。 父主题: 应用示例
能超过100M。 可单击“导入”上传音频,也可以直接拖拽本地音频文件至提示区域中,完成上传。单击左侧的图标,可试听音频效果。如果音频效果不佳,可以单击“导入”,覆盖更新音频。 图2 音频驱动 音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。
不支持Edge浏览器。 视频素材总大小小于1GB。 同时叠加的视频总数量最多支持2个。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示:
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/audition-file/{job_id} 表1 路径参数 参数 是否必选
第三方声音的费用均不同,详见语音合成界面下方的声音价格表。如魔郎朗声音的价格为30元/百万字符,那么使用魔郎朗声音进行视频制作合成时,生成音频的费用会从上面购买的套餐包中扣除。 图1 云商店 选择“语音合成体验套餐”,单击“立即购买”,进入购买页面。 下面以购买“语音合成体验套餐”为例,进行操作说明。
它们能够回答您的问题、提供天气预报、播放音乐等各种娱乐功能。 无论您身处何地,只需一声令下,机器人将立即响应,提供真正个性化的服务。 智慧管家可以通过语音识别和自然语言处理技术,与您或家人进行交互和对话。 您只需对它说出您的需求,它就会立刻执行。 无论是预约洗衣服务、订餐、调节家居温度还是其他家务,智慧管家都能轻松胜任。