数字内容生产线 METASTUDIO-华为云

数字内容生产线 METASTUDIO-MetaStudio有哪些计费项？

MetaStudio有哪些计费项？ MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。分身数字人费用：包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用：包括照片建模、语音驱动和视觉驱动的费用。资产管理费用：即服务资产管理的费用。 MetaStudio的计费详情，请参考计费说明。父主题：产品咨询

数字内容生产线 METASTUDIO 产品咨询

数字内容生产线 METASTUDIO-部分浏览器提交H265训练视频失败如何处理？:问题原因

问题原因由于Chrome等浏览器只支持硬解码H265（HEVC）视频，当您的PC硬件不支持解码H265（HEVC）视频时，Chrome等浏览器将无法播放H265（HEVC）视频，并获取不到视频分辨率等参数。在Chrome浏览器中输入“chrome://gpu”后，搜索“coding”。可以检查当前PC的浏览器是否支持H265（HEVC）视频解码。图2 查看浏览器配置用ffmpeg检查视频的编码是否是H265（HEVC），输入命令：ffmpeg -i 视频文件名。图3 检查视频是否是hevc编码需要先安装ffmpeg，安装方法如下。 ffmpeg下载地址：https://github.com/BtbN/FFmpeg-Builds/releases。 ffmpeg解压后，将其下bin目录加入系统环境变量。输入命令行ffmpeg后可以显示版本号，说明安装成功。

数字内容生产线 METASTUDIO 形象制作

数字内容生产线 METASTUDIO-功能特性

功能特性 MetaStudio提供形象制作、声音定制、分身形象视频制作、分身形象视频直播、分身形象名片制作、智能交互等能力，如表1所示。表1 功能特性功能名称功能描述应用场景形象制作拍摄真人视频，建模生成分身形象。作为虚拟形象使用，如虚拟主播、虚拟主持、虚拟客服、虚拟老师等。声音制作录制真人声音，建模生成自定义声音，或直接购买第三方声音使用。为数字人配音。视频制作使用数字人形象，设置画布、音频，合成视频。适用于各类培训、宣讲、知识分享等场景。视频直播使用数字人形象，设置画布、剧本、互动和开播配置，生成直播视频。可在合作的第三方平台进行数字人视频直播，如淘宝、拼多多、抖音等。智能交互包含下述功能实现场景：支持开箱即用的智能交互数字人。支持使用第三方语言模型，自主开发API实现与数字人对话。支持使用智能交互API或SDK，自主开发实现与数字人对话场景。智能导购、文旅导览、智能问答、营业厅客服、智能陪练等。数字人名片支持为分身数字人制作形象名片，且支持通过名片来试听语音效果。 - 照片数字人支持上传正面清晰的人像照片，生成会说话的照片数字人视频。 -

数字内容生产线 METASTUDIO

数字内容生产线 METASTUDIO-Flexus形象制作限制

Flexus形象制作限制 Flexus形象制作限制说明，如表1所示。表1 声音制作限制限制项说明 Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作，不支持视频直播和智能交互。视频制作限制 Flexus数字人采用实景拍摄，视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。需注意Flexus视频制作和标准版视频制作分开计费，从各自的套餐包中扣除费用。 Flexus视频制作：必须使用Flexus形象，声音使用不受限制。按视频制作时长计费，计费项为“Flexus分身数字人视频制作”，详见计费说明。系统声音和Flexus声音免费使用。第三方声音的计费方式，详见购买出门问问套餐包。标准版视频制作：必须使用标准版形象，声音不支持使用Flexus声音。按视频制作时长计费，计费项为“分身数字人视频制作”，详见计费说明。系统声音免费使用。第三方声音的计费方式，详见购买出门问问套餐包。父主题：使用限制

数字内容生产线 METASTUDIO

数字内容生产线 METASTUDIO-视频制作限制

视频制作限制分身数字人视频制作限制说明，如表1所示。表1 视频制作限制视频制作配置限制场景一个视频草稿的场景数量不能超过50个。文本驱动每个单场景输入文字的数量不超过1万字。所有场景输入文字的数量不超过10万字。每个单场景如果包含语音合成标记语言SSML标签，文字数量需小于128K。音频驱动每个单场景上传音频的大小不超过100M。视频格式插入的视频素材支持的格式为：MP4、M4V、MKV、MOV、FLV、3GP、WMV、AVI和WEBM。说明：在视频制作界面，如果添加视频，且视频格式为FLV、3GP、WMV、AVI时，无法展示视频播放效果，仅能图片展示。这是浏览器不兼容导致的，但是不影响视频合成效果。视频合成后，这些插入的视频可以正常播放和展示。插入的视频素材，要求如下所示：分辨率最大支持1080P。帧率小于等于30fps。编码为AV1、VP8、VP9、H264或H265格式。 VP8、VP9编码仅WEBM视频支持。 WEBM视频如果为AV1编码格式，不支持合成视频。 AV1、H265编码格式目前支持Chrome浏览器，不支持Edge浏览器。视频素材总大小小于1GB。同时叠加的视频总数量最多支持2个。音频格式音频支持的格式为：MP3、M4A、WAV。音频要求如下所示：仅提取单声道音频。音频素材总大小小于500MB。图片格式图片支持的格式为：PNG、JPG、JPEG。图片要求如下所示：分辨率最大支持1080P。图片素材总大小小于500MB。字幕字幕中正常断句的符号，如中文符号、，。：；！？….. 等；英文符号,.:;!?...等，系统会自动去除。如果自动去除的符号在一段文字中间，自动去除后，会再增加一个空格。如果自动去除的符号在段落末尾，仅直接去除。有些符号不会自动去除，如中文符号“”《》（）·~——等；英文符号""《》()·~--等。 Flexus分身数字人 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。需注意Flexus视频制作和标准版视频制作分开计费，从各自的套餐包中扣除费用。 Flexus视频制作：必须使用Flexus形象，声音使用不受限制。按视频制作时长计费，计费项为“Flexus分身数字人视频制作”，详见计费说明。系统声音和Flexus声音免费使用。第三方声音的计费方式，详见购买出门问问套餐包。标准版视频制作：必须使用标准版形象，声音不支持使用Flexus声音。按视频制作时长计费，计费项为“分身数字人视频制作”，详见计费说明。系统声音免费使用。第三方声音的计费方式，详见购买出门问问套餐包。视频制作任务视频制作历史任务保留6个月。满6个月后控制台“任务中心”菜单的“视频制作”界面，不再展示此任务。父主题：使用限制

数字内容生产线 METASTUDIO

数字内容生产线 METASTUDIO-API使用限制:API流控

API流控数字内容生产线服务对服务端API设置了调用次数限制，避免出现短时间内重复调用API，服务中断的情况。表1 API流控限制接口分类接口名称单租户接口流控（华北-北京四）单租户接口流控（华东-上海一）单租户接口流控（亚太-新加坡）数字资产管理创建资产 10次/秒 5次/秒 5次/秒查询资产列表 20次/秒 10次/秒 10次/秒更新资产 10次/秒 5次/秒 5次/秒删除资产 10次/秒 5次/秒 5次/秒查询资产详情 20次/秒 10次/秒 10次/秒恢复被删除的资产 10次/秒 5次/秒 5次/秒批量资产操作 1次/秒 1次/秒 1次/秒查询资产概要 20次/秒 10次/秒 10次/秒查询资产复制信息 20次/秒 10次/秒 10次/秒复制资产 4次/秒 3次/秒 3次/秒文件管理创建文件并获取上传URL 10次/秒 5次/秒 5次/秒删除文件 10次/秒 5次/秒 5次/秒确认文件已上传 10次/秒 5次/秒 5次/秒创建大文件 10次/秒 5次/秒 5次/秒视频制作剧本管理创建视频制作剧本 10次/秒 5次/秒 5次/秒查询视频制作剧本列表 20次/秒 10次/秒 10次/秒查询视频制作剧本详情 20次/秒 10次/秒 10次/秒更新视频制作剧本 10次/秒 5次/秒 5次/秒删除视频制作剧本 10次/秒 5次/秒 5次/秒复制视频制作剧本 10次/秒 5次/秒 5次/秒数字人视频制作管理查询视频制作任务列表 20次/秒 10次/秒 10次/秒分身数字人视频制作管理创建分身数字人视频制作任务 5次/秒 3次/秒 3次/秒查询分身数字人视频制作任务详情 20次/秒 10次/秒 10次/秒取消等待中的分身数字人视频制作任务 5次/秒 3次/秒 3次/秒数字人名片制作管理创建数字人名片制作 5次/秒 3次/秒 3次/秒查询数字人名片制作任务列表 20次/秒 10次/秒 10次/秒查询数字人名片制作任务详情 20次/秒 10次/秒 10次/秒更新数字人名片制作 5次/秒 3次/秒 3次/秒删除数字人名片制作任务 5次/秒 3次/秒 3次/秒照片数字人视频制作管理创建照片分身数字人视频制作任务 5次/秒 3次/秒 3次/秒查询照片分身数字人视频制作任务详情 20次/秒 10次/秒 10次/秒取消等待中的照片分身数字人视频制作任务 5次/秒 3次/秒 3次/秒创建照片检测任务 5次/秒 3次/秒 3次/秒查询照片检测任务详情 20次/秒 10次/秒 10次/秒智能直播间管理创建智能直播间 5次/秒 3次/秒 3次/秒查询智能直播间列表 20次/秒 10次/秒 10次/秒查询智能直播剧本详情 20次/秒 10次/秒 10次/秒更新智能直播间信息 5次/秒 3次/秒 3次/秒删除智能直播间 4次/秒 3次/秒 3次/秒创建智能直播间互动规则库 4次/秒 3次/秒 3次/秒查询智能直播间互动规则库列表 20次/秒 10次/秒 10次/秒更新智能直播间互动规则库 4次/秒 3次/秒 3次/秒删除智能直播间互动规则库 4次/秒 3次/秒 3次/秒直播任务管理启动数字人智能直播任务 4次/秒 3次/秒 3次/秒查询某个智能直播间下直播任务列表 20次/秒 10次/秒 10次/秒查询数字人智能直播任务详情 20次/秒 10次/秒 10次/秒结束数字人智能直播任务 4次/秒 3次/秒 3次/秒控制数字人直播过程 4次/秒 3次/秒 3次/秒查询租户所有数字人直播任务列表 10次/秒 5次/秒 5次/秒上报直播间事件 4次/秒 3次/秒 3次/秒直播商品管理创建商品 4次/秒 3次/秒 3次/秒查询商品列表 20次/秒 10次/秒 10次/秒更新商品 4次/秒 3次/秒 3次/秒查询商品详情 20次/秒 10次/秒 10次/秒删除商品 4次/秒 3次/秒 3次/秒商品资产组合配置 4次/秒 3次/秒 3次/秒智能交互数字人对话管理创建智能交互对话 5次/秒 3次/秒 - 查询智能交互对话列表 20次/秒 10次/秒 10次/秒查询智能交互对话详情 20次/秒 10次/秒 10次/秒更新智能交互对话信息 5次/秒 3次/秒 - 删除智能交互对话 5次/秒 3次/秒 - 智能交互数字人对话任务管理创建对话链接 5次/秒 3次/秒 - 启动数字人智能交互任务 5次/秒 3次/秒 - 结束数字人智能交互任务 5次/秒 3次/秒 - 查询数字人智能交互任务 20次/秒 10次/秒 10次/秒智能交互数字人应用管理创建应用 5次/秒 3次/秒 - 查询应用列表 20次/秒 10次/秒 10次/秒查询应用详情 20次/秒 10次/秒 10次/秒修改应用 5次/秒 10次/秒 - 删除应用 5次/秒 3次/秒 - 智能交互数字人鉴权码管理创建一次性鉴权码 20次/秒 10次/秒 - 智能交互数字人激活码管理创建激活码 5次/秒 3次/秒 - 查询激活码列表 20次/秒 10次/秒 10次/秒查询激活码详情 20次/秒 10次/秒 10次/秒修改激活码 5次/秒 3次/秒 - 重置激活码 5次/秒 3次/秒 - 删除激活码 5次/秒 3次/秒 - 智能交互数字人知识库技能管理创建知识库技能 4次/秒 3次/秒 3次/秒查询知识库技能列表 20次/秒 10次/秒 10次/秒修改知识库技能 4次/秒 3次/秒 3次/秒查询知识库技能详情 20次/秒 10次/秒 10次/秒删除知识库技能 4次/秒 3次/秒 3次/秒导出知识库技能 1次/秒 1次/秒 1次/秒智能交互数字人知识库意图管理创建知识库意图 4次/秒 3次/秒 3次/秒查询知识库意图列表 20次/秒 10次/秒 10次/秒查询知识库意图详情 20次/秒 10次/秒 10次/秒修改知识库意图 4次/秒 3次/秒 3次/秒删除知识库意图 4次/秒 3次/秒 3次/秒创建知识库意图和问法 4次/秒 3次/秒 3次/秒智能交互数字人知识库问法管理创建知识库问法 4次/秒 3次/秒 3次/秒查询知识库问法列表 20次/秒 10次/秒 10次/秒查询知识库问法详情 20次/秒 10次/秒 10次/秒修改知识库问法 4次/秒 3次/秒 3次/秒删除知识库问法 4次/秒 3次/秒 3次/秒批量创建知识库问法 1次/秒 1次/秒 1次/秒批量修改知识库问法 1次/秒 1次/秒 1次/秒智能交互数字人欢迎词管理创建欢迎词 4次/秒 3次/秒 3次/秒查询欢迎词列表 20次/秒 10次/秒 10次/秒查询欢迎词详情 20次/秒 10次/秒 10次/秒修改欢迎词 4次/秒 3次/秒 3次/秒删除欢迎词 4次/秒 3次/秒 3次/秒修改欢迎词功能开关 4次/秒 3次/秒 3次/秒查询欢迎词功能开关 20次/秒 10次/秒 10次/秒智能交互数字人热点问题管理创建热点问题 4次/秒 3次/秒 3次/秒查询热点问题列表 20次/秒 10次/秒 10次/秒查询热点问题详情 20次/秒 10次/秒 10次/秒修改热点问题 4次/秒 3次/秒 3次/秒删除热点问题 4次/秒 3次/秒 3次/秒智能交互数字人热词记录管理创建热词记录 4次/秒 3次/秒 3次/秒查询热词记录列表 20次/秒 10次/秒 10次/秒查询配置热词记录详情 20次/秒 10次/秒 10次/秒修改热词记录 4次/秒 3次/秒 3次/秒删除热词记录 4次/秒 3次/秒 3次/秒修改热词功能开关 4次/秒 3次/秒 3次/秒查询热词功能开关 20次/秒 10次/秒 10次/秒智能交互数字人委托管理查询委托 20次/秒 10次/秒 10次/秒创建委托 1次/秒 1次/秒 - 删除委托 1次/秒 1次/秒 - 分身形象制作管理创建分身数字人模型训练任务 10次/秒 3次/秒 3次/秒查询分身数字人模型训练任务列表 20次/秒 10次/秒 10次/秒查询分身数字人模型训练任务详情 20次/秒 10次/秒 10次/秒删除分身数字人模型训练任务 10次/秒 3次/秒 3次/秒更新分身数字人模型训练任务 10次/秒 3次/秒 3次/秒租户执行分身数字人模型训练任务命令 10次/秒 3次/秒 3次/秒声音制作任务管理查询用户配置的个性化音频时长 20次/秒 10次/秒 10次/秒创建基础版语音训练任务 10次/秒 3次/秒 3次/秒创建进阶版语音训练任务 10次/秒 3次/秒 3次/秒创建高级版语音训练任务 10次/秒 3次/秒 3次/秒查询语音训练任务列表 20次/秒 10次/秒 10次/秒提交语音训练任务 10次/秒 3次/秒 3次/秒查询语音训练任务详情 20次/秒 10次/秒 10次/秒删除语音训练任务 10次/秒 3次/秒 3次/秒查询任务操作日志 20次/秒 10次/秒 10次/秒获取语音文件上传地址 20次/秒 10次/秒 10次/秒获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒设置任务批次 10次/秒 3次/秒 3次/秒确认在线录音结果 10次/秒 3次/秒 3次/秒获取在线录音确认结果 20次/秒 10次/秒 10次/秒语音合成管理创建 TTS 试听任务 5次/秒 3次/秒 3次/秒获取TTS试听文件 20次/秒 10次/秒 10次/秒创建TTS异步任务 5次/秒 3次/秒 3次/秒获取TTS异步任务 20次/秒 10次/秒 10次/秒 3D数字人风格管理查询数字人风格列表 20次/秒 10次/秒 - 3D数字人风格化照片建模创建照片建模任务 2次/秒 2次/秒 - 照片建模任务列表查询 20次/秒 10次/秒 - 照片建模任务详情查询 20次/秒 10次/秒 - 基于图片URL创建照片建模任务 2次/秒 2次/秒 - 3D数字人语音驱动创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动创建视频驱动任务 2次/秒 2次/秒 - 查询视频驱动任务列表 20次/秒 10次/秒 - 查询视频驱动任务详情 20次/秒 10次/秒 - 停止视频驱动任务 2次/秒 2次/秒 - 控制数字人驱动 2次/秒 2次/秒 - 表2 API流控限制接口分类接口名称单租户接口流控系统流控租户管理查看租户资源用量信息 10次/秒 20次/秒查看租户资源列表 10次/秒 20次/秒统计时间段内资源数量 10次/秒 20次/秒

数字内容生产线 METASTUDIO

数字内容生产线 METASTUDIO-SP用户限制

SP用户限制表1 限制说明限制项说明开放范围 SP用户仅对大客户开放申请和使用。功能范围 SP用户仅支持购买大颗粒度资源包，并分配资源给关联租户使用。 SP用户不支持访问MetaStudio控制台，进行控制台操作。资源使用限制 SP用户购买形象制作时，不会赠送视频制作时长。如果用户先购买资源，再申请成为SP用户，那么每个形象制作资源赠送的视频制作时长均会被回收，无法再使用。父主题：使用限制

数字内容生产线 METASTUDIO 使用限制

数字内容生产线 METASTUDIO-计费说明:到期与欠费

到期与欠费欠费：预付费资源包没有欠费概念，按需付费是根据每个计费项在对应的计费周期进行扣费的，若余额不足，则无法对上一个计费周期进行扣费，从而导致数字内容生产线服务欠费。当您的账户欠费后，华为云将根据您的客户等级来定义云服务资源宽限期、保留期时长，更多欠费停服处理规则请参见保留期。您可以在费用中心查看账户的欠费信息，并参照欠费还款核销欠款。请注意在保留期完成续费操作。如果服务欠费后进入保留期，会在续费后解冻，服务恢复正常使用。服务到期：按需付费没有到期概念。预付费资源包到期后，若资源包中仍有额度将一次性清零，产生的费用将从余额中扣除。

数字内容生产线 METASTUDIO

数字内容生产线 METASTUDIO-计费说明:计费模式

计费模式数字内容生产线提供按需计费、包年/包月、一次性计费三种计费模式，以满足不同场景下的用户需求。按需计费模式：包含按需和按需预付费套餐包两种计费方式。按需计费：一种后付费模式，即先使用再付费。每个计费周期分别统计各资源的实际使用量，并根据使用量*单价的方式计算出费用，然后从账户余额中扣除对应金额。按需预付费套餐包：您也可以通过按需预付费套餐包的方式，提前购买使用额度，获取更多的优惠。套餐包需要在有效期内使用，且超出套餐包的部分自动转按需计费。包年/包月计费模式：一种预付费模式，即先付费再使用，按照订单的购买周期进行结算。购买周期越长，享受的折扣越大。一般适用于需求量长期稳定的成熟业务。一次性计费：一次性预付费套餐包，由MetaStudio服务进行结算。

数字内容生产线 METASTUDIO

数字内容生产线 METASTUDIO-声音更新记录:2024年12月

2024年12月表1 声音更新记录发音人名称性别 TTS版本风格语言对话女生女 TTS V7 - 中文广告男声男 TTS V7 - 中文教育女声女 TTS V7 - 中文客服男声男 TTS V7 - 中文客服女声女 TTS V7 - 中文云景行男 TTS V7 - 中文直播男声男 TTS V7 - 中文云英女 TTS V7 营销中文云海男 TTS V7 营销中文云佳女 TTS V7 营销中文云薇女 TTS V7 直播中文云辉男 TTS V7 直播中文云溪女 TTS V7 客服中文

数字内容生产线 METASTUDIO 声音制作

数字内容生产线 METASTUDIO-拍摄真人视频:绿幕数字人拍摄要求

绿幕数字人拍摄要求模特拍摄时的手部动作、面部表情以及各方面姿态，都会决定数字人最终呈现时的姿态和动作。因此，我们希望模特在拍摄时尽可能保持自然，按照平时说话和表达的习惯进行录制。为了保证数字人训练的效果，请按照我们提供的流程进行录制，请根据实际需求评估录制流程：不需要交互：15~20秒静默 + 4~5分钟自然表达需要交互：15~20秒静默 + 无语义动作 + 4~5分钟自然表达，详见交互数字人拍摄要求。需要动作编排：15~20秒静默 + 4~5分钟自然表达 + 单独拍摄动作编排片段（保持机位和人物位置不动，详细要求见附录二：动作编排定制采集指南）详细录制说明，如下所示：静默期：录制静默的初始人物状态，时长约15-20秒模特正视镜头，面带微笑，嘴巴闭合，保持静默。手部可根据习惯自然放于初始位置，如下图所示。保持合适的人物比例。图7 静默期自然表达期：录制自然说话时的嘴型、动作、状态、神情等，时长约4分30秒。按照语料逐段演讲，保持自然语速和小幅度动作，头部可自然摆动。图8 画面演示停顿时保证完全合上嘴唇，手部恢复至初始位置（建议在拍摄前简单练习）图9 错误示例图10 正反示例录制注意事项：

数字内容生产线 METASTUDIO 形象制作

数字内容生产线 METASTUDIO-拍摄真人视频:灯光布置

灯光布置合适的灯光环境将大幅提升模特的拍摄效果，我们建议：使用3~4台专业摄影灯进行打光，包括：主光、辅助光、产品光（若需要拍摄桌面产品）、背景光、轮廓光（可选），具体布光方式参考图3。图3 布置灯光录制保证过程中保证光线不发生显著变化。确保背景上的绿幕均匀明亮，避免阴影或明暗不均的情况。同时确保演员或物体与绿幕背景之间没有阴影或反光。 FAQ：如果我没有这么多灯光设备，怎么办？无需过于担心，只要保证人物被均匀、稳定地照亮，并且能清晰地和背景形成区分即可。注意要保证脸部和身体没有出现明显的阴影。在灯光设备有限的情况下，优先打亮被拍摄主体，之后再去对绿幕进行补光。

数字内容生产线 METASTUDIO 形象制作

数字内容生产线 METASTUDIO-拍摄真人视频:模特形象

模特形象分身数字人不支持替换衣服，因此，您在录制时的着装会决定您的数字人穿着。在拍摄前，我们建议参照如下条目，对您的形象进行检查。着装要求避免任何会和背景融为一体的衣服颜色。如绿幕背景下，不能穿绿色的衣服或者含有任何绿色图案的衣服。避免半透明、透光、反光的材质，避免穿带人脸图案的衣服，避免过多褶皱。避免穿着密集条纹、密集方格、密集斑点等衣服，可能会导致相机成像时有摩尔纹。避免穿戴反光、绿色成分的手表、耳钉等佩饰。不能佩戴项链或者颈链。图4 着装要求面部要求保持干净整洁的妆面造型，淡妆出镜，避免脸部过油导致反光。不佩戴眼镜、墨镜或者帽子，需要露出额头与眉毛。确保面部无零散发丝，保证无法通过头发空隙看到背景。确保面部没有较长零散的胡须。图5 错误示例图6 正确示例

数字内容生产线 METASTUDIO 形象制作

数字内容生产线 METASTUDIO-拍摄真人视频:视频提交

视频提交视频提交的详细说明，如表4所示。表4 视频提交说明视频要求项说明交付内容拍摄完成后请提交一个视频素材。推荐视频格式为MP4。视频大小通常小于5G。提交训练的视频需要保留录制时的原声。若对素材进行后处理，导出时请确保帧率与原视频保持一致。时长视频时长通常为5~6分钟。请勿剪辑视频长度，确保讲述视频、静默、手势，一起导出至同一个视频中。美颜如需对视频进行美颜等处理，确认美颜效果后，检查素材，确保不存在变形、模糊、晃动等情况，可提交训练视频。裁剪在指定时长内，包含主播身体的所有部分都要入镜，并剪切掉人像周围其他不必要元素，如绿幕边缘、拍摄设备等。命名命名规范：公司名 + _ + 模特名称 + _ + 拍摄时间（YYYYMMDD）。示例：华为云_云玲_20230925.mp4

数字内容生产线 METASTUDIO 形象制作

数字内容生产线 METASTUDIO-拍摄真人视频:收音

收音我们会使用视频中的语音和您口型变化的对应关系来训练口型驱动效果，训练结果还会经过专家的技术审核。因此在收音这方面，我们建议：保证视频音画同步。确保环境安静无噪声，模特人声清晰，无其他人声干扰，尽量减少视频的底噪。建议使用小蜜蜂或者其他专业麦克风搭配相机进行拍摄，这将大幅减少视频的底噪和其他环境噪声。但是注意：请尽量隐藏麦克风不被拍摄到，否则会导致数字人的形象中也包含麦克风。 FAQ：如果我拍摄过程中有人闯入或有突发的声音，如雷声、汽车喇叭声等，我是否要重新拍摄？根据我们的经验，小于3秒的短暂声音闯入不会对最终训练效果有明显的影响。您只需保证类似的突发声音越少越好。我可能没有专业麦克风或者小蜜蜂设备，能否直接使用相机内置麦克风录制？大部分相机内置麦克风的录制效果也能满足我们对声音的要求。我们对声音的清晰度可以有适度的妥协，但请务必保证底噪不能太大，且不能有其他人声出现，尤其是被拍摄模特正在说话的时候。

数字内容生产线 METASTUDIO 形象制作

云服务器内容精选

数字内容生产线 METASTUDIO

7*24

备案

专业服务

退订

建议反馈

售前咨询热线