云服务器内容精选

  • 视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面 表1 界面说明 序号 区 域名 称 说明 1 视频素材区域 设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作素材操作详情。 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果预置的数字人不满足用户需求,单击“定制数字人”,可以定制自己需要的数字人形象。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。 音乐:各类音乐列表,可本地导入音频文件。支持添加为背景音乐。 文本:用于在画布中添加文本。 2 画面布局区域 视频画面制作区域,可以制作和预览视频画面。 3 音频制作区域 音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。 5 文件设置区域 从左往右依次为: 单击文件名称右侧的图标,可自定义视频草稿的名称。 单击图标,保存视频制作任务。 单击图标,弹出“视频制作任务中心”对话框,可以看到视频制作任务列表,并查看当前视频的合成进展。 单击“合成视频”,合成数字人视频。 父主题: 视频制作
  • 文本 文本界面详情,如图8所示。 图8 文本界面 文本界面说明,如表7所示。 表7 界面元素说明 界面元素 说明 界面默认展示两列文本,单击图标后,缩小展示为1列文本。单击图标,可恢复为2列展示。 文本列表 系统支持的文本列表。字体分别为:鸿蒙常规、鸿蒙粗体、鸿蒙细体、鸿蒙中黑。 插入文本 将鼠标放在文本上方,文本右上角展示图标。单击图标,添加至当前场景的视频画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图9所示。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图9 文本设置
  • 视频 视频界面详情,如图6所示。 图6 视频界面 视频界面说明,如表5所示。 表5 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV、MP4、M4V、MKV、FLV、3GP、WMV、AVI或WEBM格式的视频文件上传。 也支持直接拖拽本地视频文件至视频列表区域,完成上传操作。 界面默认展示两列视频,单击图标后,缩小展示为1列视频。单击图标,可恢复为2列展示。 关键词搜索框,可输入视频名称进行精准搜索。 示例:营销视频。 筛选条件 支持通过素材来源的维度,筛选展示下方的视频。 视频列表 默认展示全量视频。 查看视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,可查看视频。 插入视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,添加至当前场景的视频画面中。 插入的视频播放的时候默认无声音,仅有画面。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:循环1次、循环播放、上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。
  • 音乐 音乐界面详情,如图7所示。 图7 音乐界面 音乐界面说明,如表6所示。 表6 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择WAV或MP3格式的音乐文件上传。 也支持直接拖拽本地音乐文件至音乐列表区域,完成上传操作。 单击图标后,音乐界面缩小展示。单击图标,可恢复为默认展示。 音乐列表 默认展示全量音乐文件。 试听音乐 将鼠标放在音乐上方,音乐名称左侧展示图标。单击图标,可试听音乐。 插入音乐 将鼠标放在音乐上方,右上角展示图标。单击图标,添加至视频草稿的所有场景中,作为视频的背景音乐。 取消应用 如果音乐已添加为视频的背景音乐,可单击音乐右上角的“取消应用”,取消使用。
  • 贴图 贴图界面详情,如图5所示。 图5 贴图界面 贴图界面说明,如表4所示。 表4 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。 关键词搜索框,可输入图片名称进行精准搜索。 示例:小贴士。 筛选条件 支持通过素材来源的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。 查看贴图 将鼠标放在图片上方,图片右上角展示图标。单击图标,可查看大图。 插入贴图 将鼠标放在图片上方,图片右上角展示图标。单击图标,添加至当前场景的视频画面中。 在视频画面预览区域,如果存在多种视频素材,支持对贴图进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。
  • 背景 背景界面详情,如图2所示。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 纯色背景 支持设置为透明背景(第一张图),此时不支持添加视频素材,且已添加的素材也会全部清除。 支持设置为纯色背景,可以选择已有的颜色,也可以自定义颜色。 筛选条件 支持通过背景、类型的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 将鼠标放在图片上方,图片右上角展示图标。单击图标,可以将当前图片作为背景替换至所有场景。
  • PPT PPT界面详情,如图3所示。 图3 PPT界面 PPT界面说明,如表3所示。 表3 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PPTX、PPT和PDF格式的文件上传。 也支持直接拖拽本地文件至文件列表区域,完成上传操作。 操作限制,如下所示: PPT文件不支持超过50页。 如果PPT的字体不支持在MetaStudio控制台展示,可能会导致视频制作时展示的PPT页面排版与实际排版不一致,建议将PPT转存为PDF文件后再导入。 操作详情请参考PPT如何转为PDF文件?。 如果PPT中有动画、动效,是不支持在MetaStudio控制台展示的,建议将PPT导出为视频后再导入。 操作详情请参考如何在MetaStudio控制台呈现PPT的动画效果?。 界面默认展示两列文件,单击图标后,缩小展示为1列文件。单击图标,可恢复为2列展示。 关键词搜索框,可输入文件名称进行精准搜索。 示例:销售指导书。 文件列表 默认展示全量文件。 查看文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,可以在弹出的界面中预览PPT的所有页面内容。 插入文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,弹出如图4所示的页面,选择文件中的页面完成插入操作。 在视频画面预览区域,如果存在多种视频素材,支持对文件页面进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 删除文件 直接单击文件右下角的图标,执行下述操作: 从下拉框中选择“删除”,删除当前文件。 从下拉框中选择“批量删除”,勾选所有需要删除的文件。单击界面右下角的“删除”,删除选中的所有文件。 文件上传成功后的操作如下所示: 在PPT页签的文件列表区域,单击上传成功的文件,弹出如图4所示的对话框。 图4 插入页面 勾选需要插入的页面或直接全选所有界面,单击“复制当前场景”或“新增场景”,添加至当前视频草稿中。 新增1个视频草稿,默认会有1个场景,用户可以自定义此场景,也可以保持不变。MetaStudio按文件页面依次生成对应的场景,即一个页面对应生成一个场景。 不同的操作的含义为: 复制当前场景:插入的文件页面直接复制第一个场景,粘贴生成新场景,即新场景中完全复用第一个场景的背景、数字人等内容,同时再包含文件的选中页面。 如果插入文件之前,已经有多个场景,需要选中希望复制的场景,去插入文件页面。 新增场景:插入的文件直接复制第一个场景的数字人和背景,其余视频素材效果不会被复制。同时包含文件的选中页面,生成对应的新场景。 如果插入文件之前,已经有多个场景,需要先选中希望的数字人及其背景的场景,再去插入文件页面。 等待所有页面插入完成后,参考视频制作对场景进行定制。
  • 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 角色界面默认展示两列数字人,单击图标后,缩小展示为1列数字人。单击图标,可恢复为2列展示。 关键词搜索框,可输入数字人名称进行精准搜索。 示例:yun lan。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域、分辨率和动作的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换更新至视频草稿的所有场景中。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 在视频画面预览区域,如果存在多种视频素材,支持对数字人进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身 视频直播 ”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 分身视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如视频直播界面说明所示,对应操作说明如下所示。详细操作说明,请参考视频直播素材操作详情。 在左侧的素材区域,除了系统预置的视频素材外,角色还可以自定义定制数字人;背景、贴图、视频还支持从本地导入使用;商品可以自主创建;文本可自主输入文字内容。 从素材区域添加到预览窗口中的贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等操作。还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择下述一种直播剧本驱动方式。 “剧本驱动”包含3种方式: 文本驱动 需要通过文本驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,新增更多的段落。 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。 多音字 选中文字,设置多音字的正确读音。 全局语速 设置全局语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 助播 选中一段文字,设置为助播来播报这段内容。 全局声音(主播) 主播全局声音,适用于直播间所有场景。如果单场景有单独设置声音,优先使用单场景的声音播报。 有默认声音,用户也可以根据实际情况选择其他声音。 如果需要使用标注“第三方”的系统声音,请参考购买出门问问声音套餐进行操作。 全局声音(助播) 助播全局声音,适用于直播间所有场景。单场景不支持单独设置助播声音。 开播后的效果,如图3所示。如需进行互动,可单击图标,切换到助播声音。输入并发送互动内容,主播暂停播报,并使用助播声音插播发送成功的互动内容。 导入 支持从本地导入文本文件,解析生成段落内容。 导入文件需满足: 支持txt格式,且字数不低于200字。 文本内容根据换行,自动解析为段落。 试听 单击“试听”,可以试听当前直播间剧本。 默认使用全局主播声音播报,如果单场景有单独设置声音,优先使用单场景的声音播报。单独标注助播的内容,会使用全局助播的声音进行播报。 也可以单击段落区域的试听图标,试听当前段落。 场景操作 支持对场景,执行下述操作: :修改场景名称,默认值为“场景1” :设置当前场景播报的声音,直播时会优先使用此声音播报当前场景内容。 :复制当前场景,新增一个相同场景。 :删除当前场景。 :调整场景的位置。 :为当前场景新增1个空白段落。 段落操作 支持对段落,执行下述操作: :修改段落名称,默认值为“段落1.1”。 :试听当前段落的播报效果。 :复制当前段落,新增一个相同段落。 :删除段落。 :调整段落在场景中的位置。 :新增1个空白段落。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,用于开播后,使用主播或助播声音,播报发送的互动内容。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 开播后可单击如图5所示的图标,切换到全局主播或助播的声音,发送互动内容成功后,播报互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,可以单击直播画面预览窗口右侧“场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 图7 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图8所示。 互动设置包含4类设置:弹幕、用户入场、点赞和送礼。支持直接导入互动管理中设置好的互动库,也支持在当前直播间逐条设置互动规则。所有类型总计可添加100个互动规则。 这4类互动设置新增互动规则的操作基本相同,下面以弹幕为例,进行操作说明。 图8 互动设置 单击图8中的“添加规则”,展示如图9所示的界面。 界面下方新增1个规则设置。 先设置用户弹幕触发规则的关键词,如果有多个,请以“|”分隔,示例“链接|型号|优惠”。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前规则内容。 在下方选择主播或助播回复用户问题,回复内容支持通过下述2种方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以加强回复效果。图片和视频的添加和设置方式完全相同,下面以图片为例,进行操作说明。 单击下方的“+”区域框,从本地选择图片或视频,添加到“+”区域框中。 添加成功后,区域框展示图片缩略图,如所示。 将鼠标放在区域框中,区域框变化为形式。 单击“预览”,图片被添加到直播画面预览窗口中,可根据实际情况拖动图片的展示位置或者调整图片大小。 图9 弹幕设置 单击“新增”,可参考6.a,添加更多的弹幕回复规则。 等所有弹幕规则增加完成后,支持单击“新增兜底”,新增新增一条兜底规则,设置方式与6.a相同。 其含义为:用户问题如果未匹配到已有规则,可触发兜底回复,仅支持设置1条兜底回复。 支持对已有规则,执行下述操作: 批量管理:支持批量设置所选规则使用的场景,或批量删除所选规则。 弹幕回显:开启“弹幕回显”后,在直播画面中可以看到一条文本信息:正在回复[用户名称]:[弹幕内容]。 全部启用:可以直接“全部启用”所有规则。 :设置单规则使用的场景。 :启用或关闭当前规则。 :删除规则。 单击界面右侧的“直播配置”页签,如图10所示。 直播配置说明,如表2所示。 图10 我的视频 表2 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 输出设置 直播画面 选择直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。 播放次数 设置直播循环播放的次数,或“无限循环”。 默认播放1次。 直播窗口 直播窗口展示尺寸,不同方案均可调整为竖向。 包含如下选项: 竖屏 全屏:推荐用全屏,捕获的画面更大,需在直播伴侣中旋转使用。 默认为“竖屏”。 更多设置 事件回调地址 可在直播中返回场景、段落事件的字段,适用于接口调用或客户二次开发使用的场景。 直播间ID 无需设置,当前直播间保存后自动展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备开播”,准备开播。 默认勾选“加载完自动直播”,单击“准备开播”加载完成后自动开播。 如果希望延迟开播,先取消勾选“加载完自动直播”,再单击“准备开播”。当需要开播时,在相同位置单击“开始直播”即可启动直播。 使用即兴直播方式开播,仅需单击“准备开播”即可启动直播。 文本驱动和音频驱动方式,还需确认风险提示。建议按照系统建议优化完成后,再启动直播。 弹出“风险提示”对话框,如图11所示。 用户需要参照风险提示项,逐一核查并优化直播内容。 图11 风险提示 用户可以等直播风险消除后再开播,也可以直接选择“承担风险开播”后,等待直播启动。 直播启动成功后,直播画面预览窗口中,会展示直播启动的进度。 开播后的效果如图12所示。界面右下方的操作说明,如表3所示。 图12 开播页面 表3 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,关闭当前直播。
  • 绿幕数字人拍摄要求 模特拍摄时的手部动作、面部表情以及各方面姿态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为了保证数字人训练的效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15~20秒静默 + 4~5分钟自然表达 需要交互:15~20秒静默 + 无语义动作 + 4~5分钟自然表达,详见交互数字人拍摄要求。 需要动作编排:15~20秒静默 + 4~5分钟自然表达 + 单独拍摄动作编排片段(保持机位和人物位置不动,详细要求见附录二:动作编排定制采集指南) 详细录制说明,如下所示: 静默期:录制静默的初始人物状态,时长约15-20秒 模特正视镜头,面带微笑,嘴巴闭合,保持静默。手部可根据习惯自然放于初始位置,如下图所示。 保持合适的人物比例。 图8 静默期 自然表达期:录制自然说话时的嘴型、动作、状态、神情等,时长约4分30秒。 按照语料逐段演讲,保持自然语速和小幅度动作,头部可自然摆动。 图9 画面演示 停顿时保证完全合上嘴唇,手部恢复至初始位置(建议在拍摄前简单练习) 图10 错误示例 图11 正反示例
  • 视频提交 视频提交的详细说明,如表5所示。 表5 视频提交说明 视频要求项 说明 交付内容 拍摄完成后请提交一个视频素材。 推荐视频格式为MP4。 视频大小通常小于5G。 提交训练的视频需要保留录制时的原声。 若对素材进行后处理,导出时请确保帧率与原视频保持一致。 时长 视频时长通常为5~6分钟。请勿剪辑视频长度,确保讲述视频、静默、手势,一起导出至同一个视频中。 美颜 如需对视频进行美颜等处理,确认美颜效果后,检查素材,确保不存在变形、模糊、晃动等情况,可提交训练视频。 裁剪 在指定时长内,包含主播身体的所有部分都要入镜,并剪切掉人像周围其他不必要元素,如绿幕边缘、拍摄设备等。 命名 命名规范:公司名 + _ + 模特名称 + _ + 拍摄时间(YYYYMMDD)。 示例:华为云_云玲_20230925.mp4
  • 附录一:拍摄检查项 拍摄完成后,可逐行检查拍摄的视频是否满足标准。 表6 检查项 检查项 是否满足 模特未说话时嘴巴保持闭合 绿幕上没有明显阴影 演员脸部和头部未出现碎发或零散发丝 演员全程未挪动位置 演员眼睛未明显观看提词器 视频长度大于等于5分钟 演员未穿着绿色或带有绿色图案的衣服 演员未穿戴反光的金属耳饰、手链、手表 演员未穿带半透明、透光、反光材质的衣服 演员未佩戴眼镜、墨镜、帽子 演员做手势时未超出画面 演员已将麦克风隐藏,无法直接看到 视频中未包含含义明确的动作,比如竖大拇指、比数字等 演员动作幅度适当,未遮挡面部
  • 概览 如需使用华为云MetaStudio服务定制分身数字人形象,需要参考本章节,完成分身数字人形象的采集工作。 请注意,分身数字人形象的制作效果与拍摄录制的内容效果有较大关联,为了后续能够体验到更好的数字人应用效果,我们建议您详细阅读每一节内容,并严格按照每节内容描述的标准进行拍摄。 表1是数字人拍摄视频标准概览内容,详细说明请参考本章节后面的描述。 表1 数字人拍摄标准概览 拍摄准备项 拍摄准备子项 拍摄标准说明 拍摄规格 - 视频总时长为5分钟,分辨率和帧率为4K、25fps或以上,格式为MP4或MOV。 场地布置 背景 使用颜色均匀、无破损、无褶皱的绿幕背景。 灯光 使用均匀、稳定的光照,标准日光色色温。 保证拍摄者光线充足,面部无阴影。 录制过程中光线确保不发生显著变化。 机位 相机与人物眼神平齐,对焦模特面部区域,确保面部清晰不失焦。建议竖拍,效果更佳。 收音 保证环境安静无噪声、无回声,并避免其他人声的干扰。 模特 面部 避免面部过油导致反光。 确保面部无零散发丝。 尽量不佩戴眼镜,以免反光。 保证模特轮廓清晰,精神饱满。 着装 避免穿着与绿幕颜色相近的绿色服饰,避免衣服上带绿色图案。 不佩戴可能反光的金属耳饰、手链和手表。 姿态动作 面带微笑。头部可自然摆动,动作自然,避免幅度过大。做完动作后,手部返回至初始位置。未说话时,请保持嘴巴闭合状态。 录制台本 - 提前准备中文或英文台本,建议使用提词器,确保阅读流畅。阅读中出现错误,不影响最终效果,无需停止录制。条件允许情况下,建议使用您自己熟悉的台本。 视频提交 - 训练视频需保留原声,音画必须同步。 视频请勿剪辑,确保讲述视频、静默、手势,均导出至同一个视频中。
  • 拍摄规格 推荐的相机拍摄规格清单,如表2所示。 表2 相机拍摄规格 拍摄规格 标准 分辨率和帧率 4K、25fps及以上 光圈 小于F4,避免景深过浅出现明显虚化 ISO 100~800,避免ISO过高出现噪点 白平衡 3500~5500K,全程固定白平衡。 录制格式 H.264或H.265编码 码率 大于60M 颜色位深 10bit或8bit 快门速度 必须小于等于“1/(帧率 * 4)” 示例:帧率60,则快门速度小于等于1/240。
  • 收音常见问题 如果我拍摄过程中有人闯入或有突发的声音,如雷声、汽车喇叭声等,我是否要重新拍摄? 根据我们的经验,小于3秒的短暂声音闯入不会对最终训练效果有明显的影响。您只需保证类似的突发声音越少越好。 我可能没有专业麦克风或者小蜜蜂设备,能否直接使用相机内置麦克风录制? 大部分相机内置麦克风的录制效果也能满足我们对声音的要求。我们对声音的清晰度可以有适度的妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。