检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
算法应用场景 数字人视觉驱动算法可用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。 算法目的意图 视频驱动数字人动作,实现影视制作动画快速生成。 虚拟现实Avatar形象姿态控制。
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如视频制作界面说明-图1所示。
操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.zip”为SDK安装包的本地存放路径及安装包名称,请根据实际情况修改。
如果用户在第三方直播平台的直播画面没有声音,需排查是否是OBS工具设置的桌面音频设备与Windows系统的声音输出设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。
上传资产 支持从本地上传资产,包括:模型、PPT、动画、素材、视频、场景、图片、音乐。资产上传的操作均相同,下面以上传图片为例进行演示。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。
设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 音量:设置声音大小,取值范围[90,240]。为保证播放音量适中,建议用户调大初始音量。 音高:设置声音高低,取值范围[50,200]。
单击,在弹出的下拉框中,可下载视频至本地、查看详情、重命名或删除视频。 图1 照片数字人视频 父主题: 照片数字人
单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。 单击,在弹出的下拉框中,可查看名片详情、重命名或删除名片。 图1 分身数字人名片 父主题: 数字人名片制作
支持在视频制作界面,导入本地PPT作为视频素材使用。如果PPT中有动画、动效,不支持在MetaStudio控制台展示,建议将PPT导出为视频后,再在导入本地视频的位置导入视频,进行视频制作。
智能交互客户端SDK 前提条件 SDK概述 SDK下载 Web SDK 父主题: 智能交互
首先我们来认识一下这个喵影客户端的界面,主要就是三个大块,左上角这个区域,是我们的功能区,素材库、音频、文字、转场、特效、贴纸、模板都可以在这个区域里面找到。 下方是时间线编辑区,剪辑工作就是在这里完成的,右上角是预览区,就是一个小电视,另外还有工具栏和菜单栏,两个小长条。
单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。 图1 名片生成任务 父主题: 数字人名片制作
Web SDK 快速入门 接口参考 常见问题 SDK隐私声明 SDK合规使用指南 修订记录 父主题: 智能交互客户端SDK
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。
单击“下载至本地”,下载数字人名片至本地。下载后的文件为mp4格式。 图4 名片生成成功 父主题: 数字人名片制作
修订记录 表1 修订记录 修改时间 修改说明 2024-11-13 本次变更如下: 新增发布2.1.0版本SDK,相比2.0.3版本,变更点如下所示: 支持文本问答。 startChat新增入参,参考表14,用来设置交互模式(语音问答/文本问答)。 新增接口activeInteractionMode
示例7:视频直播对接实时音视频客户端SDK 视频直播对接实时音视频客户端SDK应用示例代码,请参考MetaStudio数字人直播对接实时音视频客户端SDK。 父主题: 应用示例
下载SDK安装包 表1 SDK下载 SDK名称 SDK包 开发者 个人信息处理规则 合规使用指南 HwICSUiSDK 参见表2下载链接 华为云计算技术有限公司 SDK如何处理个人信息请参见SDK隐私声明 您集成和使用我们的SDK时需要遵从个人信息保护基本要求,详情请参见SDK合规使用指南
设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 助播 选中一段文字,设置为助播来播报这段内容。 全局声音(主播) 主播全局声音,适用于直播间所有场景。如果单场景有单独设置声音,优先使用单场景的声音播报。