检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,单击“资源管理”,进入“资源管理”页面,如图2所示。 图2 资源管理
制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面,如图所示。 图3 任务列表 单击任务所在行的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。
变更交互任务信息的事件。交互任务状态发生变化时,会通知使用方。如果交互任务就绪,jobInfo中的jobId为进行中的任务ID,否则jobId为空字符串。 【回调参数】 jobInfo:JobInfo类型。字段定义如表3所示。 表3 JobInfo 参数 类型 描述 jobId string 任务ID。
方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传
预付费资源包中扣除1次。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。 照片建模的含义:根据单张照片自动生成3D风格化基础模型。 按需计费 按需预付费套餐包 语音驱动 按照输入文本或语音驱动数字人口型、表情等动作的时长进行计费。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。
其中,“digital-assets”也是接口查询资产列表URI中的值。 在右侧界面的“Preview”页签中,可以看到所有音色的“asset_id”,即要查询的音色ID。 图2 查询音色ID 使用接口查询音色ID 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offse
CertUtil: -hashfile 命令成功完成。 参考表1,下载SDK安装包完整性校验文件至本地。 使用文本编辑器打开完整性校验文件,查看文件中的SHA256值和2中生成的SHA256值是否一致。 如果一致,说明SDK安装包下载过程中,不存在篡改和丢包现象。 父主题: SDK下载
高品质:约5个工作日。 自定义声音应用方式,如下所示: 自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。 演讲过程中不限制说话的内容
用,您只需要为您账号中的资源进行付费。关于IAM的详细介绍,请参见《IAM产品介绍》。 MetaStudio不支持企业项目。 MetaStudio权限 默认情况下,新建的IAM用户没有任何权限,您需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,
要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”。 单击“对话机器人服务 CBS”,进入控制台页面,如图1所示。 请确认当前页面,是否包含问答机器人列表。 如果包含,直接执行4。
状态码 调用数字内容生产线API时,可能返回的状态码如表1 状态码所示。 表1 状态码 返回值 说明 200 OK 请求正常。 201 Created 创建类的请求完全成功。 202 Accepted 已经接受请求,但未处理完成。 204 No Content 请求完全成功,同时HTTP响应不包含响应体。
资产。 找到需要转移的资产,单击资产右下角的,从下拉框中选择“转移”,弹出“资产转移”对话框,如图2所示。 参数配置说明,如表1所示。 图2 资产转移 表1 参数说明 参数 说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。 备注 转移资产的备注信息。
Flexus分身数字人限制 Flexus分身数字人限制说明,如表1所示。 表1 声音制作限制 限制项 说明 Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。
页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 91+ Android
”为例,进行操作演示。 前提条件 当前用户已拥有SP账号。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 单击“
直播间的“商品”页签中,供直播间添加使用。操作请参考商品管理。 直播任务管理:用户创建的直播间列表。支持通过直播间任务进入直播间,修改直播间内容后,重新开播。操作请参考直播任务管理。 图1 首页面 直播间界面 视频直播制作界面如图2所示。各区域详细说明,如表1所示。 图2 视频直播制作界面
得更好的拍摄效果。在演讲过程中,可以做一些自然的手部动作,但是不能做一些有明确含义的动作,比如数字手势、挥手、握拳等。同时,也不能做大幅度的手势动作,比如将手超过肩部,或将手挡住脸部。每次动作完成后,需要把手放回到初始位置后再做下一个动作。在说话过程中,尽量保证身体不要大幅度晃动
登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“基础版声音制作”,音频格式为WAV或MP3文件。需整段录制,每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。
分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需小于2000,