检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
完成分身数字人形象的采集工作。 请注意,分身数字人形象的制作效果与拍摄录制的内容效果有较大关联,为了后续能够体验到更好的数字人应用效果,我们建议您详细阅读每一节内容,并严格按照各章节内容为标准进行拍摄。 下面是数字人拍摄视频标准概览内容,详细的说明,请参考具体的章节。 表1 数字人拍摄标准概览
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
一类是使用MetaStudio控制台功能生成的,如下所示: 用户在控制台进行形象制作,生成的数字人形象,会展示在“我的创作 > 分身形象”页面。 用户在控制台进行声音制作,生成的声音,会展示在“我的创作 > 声音”页面。 用户在控制台进行视频制作,合成的视频,会展示在“我的创作 > 视频”页面。 用
提供的项目ID对应Region保持一致。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。
避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。 演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。
(可选)提升问答交互次数 科大讯飞免费赠送500次/天的问答交互次数,如需提升问答交互次数,请参考本节操作,订购套餐包。 操作步骤 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考
声音制作任务算法训练完成后,可以查看声音。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单击“视频
支持使用预置的,也支持自定义生成。 画面布局:简称“画布”,如图中2区域所示。可以在画布中插入人物形象、背景、贴图、文本框、视频等内容,支持调整各项直播素材的大小和图层位置。所有的设置效果均在画布中直观可见。 开播设置:简称“设置”,如图中3区域所示,包括视频直播的各类设置。 剧
送资产给当前租户。 声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产的接收、激活操作为例演示。 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上方的图标,进入“接收资产管理”页面,如图2所示。
送资产给当前租户。 声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产的接收、激活操作为例演示。 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上方的图标,进入“接收资产管理”页面,如图2所示。
命令成功完成。 参考表1,下载SDK安装包完整性校验文件至本地。 使用文本编辑器打开完整性校验文件,查看文件中的SHA256值和2中生成的SHA256值是否一致。 如果一致,说明SDK安装包下载过程中,不存在篡改和丢包现象。 父主题: SDK下载
在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户注册奇妙问的手机号。 APPSECRET
图3 待接收资产 单击界面左上方的“返回”,回到“资源 > 已激活”页面。 选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产
购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问语音合成套餐包:在云商
今天给大家准备了两种不同口味,有酱香味的和麻辣味的。 想吃麻辣香锅但又不太能吃辣的宝宝们有口福了。 不能吃辣的宝宝,等会下单的时候选酱香口味。 辣的和不辣的都想尝试的宝宝可以分别选择哈,喜欢哪个就选哪个。 他家麻辣香锅的特点就是: 第一、麻辣鲜香,香而不咸 第二、里面的配菜非常丰富量也很足,有乌冬面、蔬菜、鱼丸、素毛肚……
有时PPT的字体不支持在MetaStudio控制台展示,建议将PPT转存为PDF文件后,在导入本地PPT的位置,重新导入PDF文件,进行视频制作。 PPT转PDF的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 另存为”。 选择另存的文件类型:PDF。
面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。
数字人语音驱动算法可用于短视频制作、直播、交互等场景。在特定场景中,可替代人快速生成视频内容,以提升内容生成的效率。 算法目的意图 通过学习语音与表情基系数的关系,实现使用语音生成视频的能力。在使用数据人形象生成视频的场景,包括短视频制作、直播、智能交互等,可快速生成不同台词的视频内容。
资产标题:图片的标题。 图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击“图片上传”区域,从本地选择需要上传的图片资产。 单击界面右上方的“保存”,在弹出的“资产保存成功”对话框中,单击“知道了”。