检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建分身数字人模型训练任务 功能介绍 该接口用于创建分身数字人模型训练任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型
模型审核和制作可以加快吗? 为了保证模型质量,确保素材符合拍摄要求,训练前素材会经过人工审核。原则上不支持催审和加速,请耐心等待。模型审核制作耗时详情,如表1所示。 表1 模型制作耗时 模型类型 制作耗时 声音模型 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。
更新分身数字人模型训练任务 功能介绍 该接口用于更新分身数字人模型训练任务。用于在自动审核或者人工审核不通过情况下,更新训练视频、身份证照片等。 该接口只能在AUTO_VERIFY_FAILED或者MANUAL_VERIFY_FAILED状态下调用 调用方法 请参见如何调用API。
租户执行分身数字人模型训练任务命令 功能介绍 该接口用于租户执行分身数字人模型训练任务命令,如提交训练审核等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}/command
删除分身数字人模型训练任务 功能介绍 该接口用于删除分身数字人模型训练任务。同时需要删除训练任务相关的训练视频、身份证照片、授权文件、模型资产等。 该接口应当在任务处于以下状态时调用:WAIT_FILE_UPLOAD、AUTO_VERIFY_FAILED、MANUAL_VERIF
G: 训练数据预处理中 TRAINING_DATA_PREPROCESS_FAILED: 训练数据预处理失败 TRAINING_DATA_PREPROCESS_SUCCESS: 训练数据预处理完成,等待训练资源中 TRAINING: 训练中 TRAIN_FAILED: 训练失败 TRAIN_SUCCESS:
G: 训练数据预处理中 TRAINING_DATA_PREPROCESS_FAILED: 训练数据预处理失败 TRAINING_DATA_PREPROCESS_SUCCESS: 训练数据预处理完成,等待训练资源中 TRAINING: 训练中 TRAIN_FAILED: 训练失败 TRAIN_SUCCESS:
提交语音训练任务 功能介绍 提交训练任务,执行该接口后,任务会进入审核状态,审核完成后会等待训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{proj
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
删除语音训练任务 功能介绍 删除语音训练任务 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{proj
获取语音训练任务审核结果 功能介绍 获取语音训练任务审核结果。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/audit-result 表1 路径参数 参数 是否必选
之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 须知: 声音训练完成后,可以在“我的创作 > 声音”页面,找到训练好的声音卡片,单击右下角的图标,从下拉框个中选择“重命名”,修改声音名称。
算法基本原理 分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。 输出结果:数字人视频。
String 训练类型。 BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取
String 训练类型。 BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取
基于盘古数字人大模型,华为云MetaStudio打造了一站式、全流程的数字人直播服务,通过高效的训练和推理服务,重塑千行百业的电商直播。 数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3倍以上。在数字人模型生成以后,可以通过模型驱动推
Flexus支持通过API集成使用吗? 支持,详见接口创建分身数字人模型训练任务的is_flexus字段。 父主题: API和SDK使用
控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio