数字内容生产线 METASTUDIO-视频制作限制

时间:2024-09-12 14:06:41

视频制作限制

分身数字人视频制作限制说明,如表1所示。

表1 视频制作限制

视频制作配置

限制

多场景配置

  • 每个单场景,如果通过“文本驱动”方式生成语音时,所有段落汇总的文字数量需大于200字。
  • 每个单场景,如果通过“音频驱动”方式生成语音时,每个音频时长需大于1分钟。

文本驱动配置

通过“文本驱动”方式生成语音时,对应的文本要求,如下所示:

  • 每个段落的文本字符数量需小于2000,如果包含 语音合成 标记语言SSML标签时,需小于3000。
  • 一个视频草稿,所有段落汇总字符数,如果包含语音合成标记语言SSML标签时,需小于300000。

视频格式

视频支持的格式为:MP4、M4V、MKV、MOV、FLV、3GP、WMV、AVI和WEBM。

说明:

在视频制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。

视频要求如下所示:

  • 分辨率最大支持1080P。
  • 帧率小于等于30fps。
  • 编码为AV1、VP8、VP9、H264或H265格式。
    • VP8、VP9编码仅WEBM视频支持。
    • WEBM视频如果为AV1编码格式,不支持合成视频。
    • AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。
  • 视频素材总大小小于1GB。
  • 同时叠加的视频总数量为3,包含互动时配置的视频。

音频格式

音频支持的格式为:MP3、M4A、WAV。

音频要求如下所示:

  • 仅提取单声道音频。
  • 音频素材总大小小于500MB。

图片格式

图片支持的格式为:PNG、JPG、JPEG。

图片要求如下所示:

  • 分辨率最大支持1080P。
  • 图片素材总大小小于500MB。

字幕

字幕中正常断句的符号,如中文符号、,。:;!?….. 等;英文符号,.:;!?...等,系统会自动去除。

  • 如果自动去除的符号在一段文字中间,自动去除后,会再增加一个空格。
  • 如果自动去除的符号在段落末尾,仅直接去除。

有些符号不会自动去除,如中文符号“”《》()·~——等;英文符号""《》()·~--等。

Flexus分身数字人

Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。

需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。

  • Flexus视频制作:必须使用Flexus形象,声音使用不受限制。
    • 按视频制作时长计费,计费项为“Flexus分身数字人视频制作”,详见计费说明
    • 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包
  • 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。
    • 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明
    • 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包
support.huaweicloud.com/productdesc-metastudio/metastudio_01_0013.html