检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
/v1/{project_id}/digital-human-training-manage/user/jobs 创建分身数字人模型训练任务 GET /v1/{project_id}/digital-human-training-manage/user/jobs 查询分身数字人模型训练任务列表 GET /v1/{p
创建分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 查询分身数字人模型训练任务列表 20次/秒 10次/秒 10次/秒 查询分身数字人模型训练任务详情 20次/秒 10次/秒 10次/秒 删除分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 更新分身数字人模型训练任务 10次/秒
接收资产 支持接收资产管理员或其他租户转移给当前租户的声音和分身模型资产。声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产为例进行操作演示。 注意事项 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要
String 参数解释: 数字人模型建模类型。 约束限制: 不涉及 取值范围: UPLOADED:租户上传的模型 PICTURE_MODELING:照片建模生成的模型 CHARACTER_CUSTOMIZATION_MODELING:捏脸生成的模型 默认取值: UPLOADED modeling_job_id
(华为云CBS)。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型、出门问问的数字人平台。 科大讯飞对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(科大讯飞)。 出门问问的数字人平台对接至智能交互服务,开发
服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动
String 参数解释: 数字人模型建模类型。 约束限制: 不涉及 取值范围: UPLOADED:租户上传的模型 PICTURE_MODELING:照片建模生成的模型 CHARACTER_CUSTOMIZATION_MODELING:捏脸生成的模型 默认取值: UPLOADED modeling_job_id
收音 收音说明 MetaStudio会使用视频中的语音,对应您口型的变化,来训练口型驱动效果,训练结果还会经过专家的技术审核。 所以在收音这方面,建议如下: 保证视频音画同步。 确保环境安静无噪声,模特人声清晰,无其他人声干扰,尽量减少视频底噪。 建议使用小蜜蜂或其他专业麦克风搭
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
PREPROCESSING:MetaStudio直播服务启动加载形象模型的状态。 PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCESSING:数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。 PLAY_PAUSE:数字人直
单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。
方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传
照片建模任务出现异常问题怎么办? 若界面提示模型名重复 由于同一个账号下模型名称不可以重复,因此,您需要重新更换模型名称。 若界面提示照片太大 请您重新更换一个大小低于6MB照片。 父主题: 照片建模
查看声音 声音制作任务算法训练完成后,可以查看声音。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
HUMAN_MODEL_2D: 分身数字人模型 BUSINESS_CARD_TEMPLET: 数字人名片模板 3D数字人资产: HUMAN_MODEL:3D数字人模型 SCENE:场景模型 ANIMATION:动作动画 MATERIAL:风格化素材 NORMAL_MODEL: 普通模型 cover_url
各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所包含的音色模型所占存储空间,暂不计入租户资产存储计费中。 定制视频资产存储 基于MetaStudio服务定制生成的视频资产,6
width 否 Integer 参数解释: 图层图片左上角像素点的Y轴位置值图层图片宽度像素值(相对画布大小)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。
47000013 model file down fail 请检查人物模型资产文件是否存在,不存在请更换人物模型,如果存在请联系技术支持 MSS.47000014 background file down fail 请检背景图片资产文件是否存在,不存在请更换背景,如果存在请联系技术支持
模特表现 模特表现 拍摄过程中模特的手部动作、面部表情及各方面的状态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为保证数字人的训练效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15-30秒静默