云服务器内容精选

  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如视频制作界面说明-图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域上方的图标,切换视频画面比例为横屏“16:9”或竖屏“9:16”。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。 Flexus视频制作:必须使用Flexus形象,声音使用不受限制。 按视频制作时长计费,计费项为“Flexus分身数字人视频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问 语音合成 套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问语音合成套餐包。 画布制作完成后,再制作语音。 支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四 日期:十月二十四 电话:幺零二四 示例英文“API”的读法如下所示: 字母:API 单词:api 音标 选中英文单词,输入合适的音标。 局部语速 选中需要变速播报的文本,设置局部语速。 取值范围[0.5x,2x],含义如下所示: 0.5x:0.5倍速播报,即减速播报。 2x:2倍速播报,即加速播报。 全局语速 设置全局语速。 取值范围[0.5x,2x],含义如下所示: 0.5x:0.5倍速播报,即减速播报。 2x:2倍速播报,即加速播报。 音色设置 单击音色名称,在弹出的声音对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 带有标识的为Flexus声音,仅支持搭配Flexus数字人使用。如果视频为标准版形象,不支持选择Flexus声音进行视频合成。 试听 单击“试听”,试听语音效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标可开启字幕展示,并可在画布左侧设置字幕的字体、大小和位置等。 “音频驱动”方式目前仅支持中文普通话的场景开启字幕。 图标 展示当前视频的宽高比。 图标 第一次单击可折叠“文本驱动/视频驱动”,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传音频,也可以直接拖拽本地音频文件至提示区域中,完成上传。单击左侧的图标,可试听音频效果。如果音频效果不佳,可以单击“导入”,覆盖更新音频。 图2 音频驱动 音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页,详情请参见PPT。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签后,右侧页签选择“视频草稿”,查看视频草稿列表,如图4所示。 图4 视频项目 将鼠标移至卡片的文字描述区域,单击“编辑视频”,如图5所示。 进入 视频编辑 界面,更新视频内容,重新合成视频。 图5 我的视频
  • 视频 视频界面详情,如图6所示。 图6 视频界面 视频界面说明,如表5所示。 表5 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择MOV、MP4、M4V、MKV、FLV、3GP、WMV、AVI或WEBM格式的视频文件上传。 也支持直接拖拽本地视频文件至视频列表区域,完成上传操作。 界面默认展示两列视频,单击图标后,缩小展示为1列视频。单击图标,可恢复为2列展示。 关键词搜索框,可输入视频名称进行精准搜索。 示例:营销视频。 筛选条件 支持通过素材来源的维度,筛选展示下方的视频。 视频列表 默认展示全量视频。 查看视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,可查看视频。 插入视频 将鼠标放在视频上方,视频右上角展示图标。单击图标,添加至当前场景的视频画面中。 插入的视频播放的时候默认无声音,仅有画面。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:循环1次、循环播放、上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。
  • 音乐 音乐界面详情,如图7所示。 图7 音乐界面 音乐界面说明,如表6所示。 表6 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择WAV或MP3格式的音乐文件上传。 也支持直接拖拽本地音乐文件至音乐列表区域,完成上传操作。 单击图标后,音乐界面缩小展示。单击图标,可恢复为默认展示。 音乐列表 默认展示全量音乐文件。 试听音乐 将鼠标放在音乐上方,音乐名称左侧展示图标。单击图标,可试听音乐。 插入音乐 将鼠标放在音乐上方,右上角展示图标。单击图标,添加至视频草稿的所有场景中,作为视频的背景音乐。 取消应用 如果音乐已添加为视频的背景音乐,可单击音乐右上角的“取消应用”,取消使用。
  • 文本 文本界面详情,如图8所示。 图8 文本界面 文本界面说明,如表7所示。 表7 界面元素说明 界面元素 说明 界面默认展示两列文本,单击图标后,缩小展示为1列文本。单击图标,可恢复为2列展示。 文本列表 系统支持的文本列表。字体分别为:鸿蒙常规、鸿蒙粗体、鸿蒙细体、鸿蒙中黑。 插入文本 将鼠标放在文本上方,文本右上角展示图标。单击图标,添加至当前场景的视频画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图9所示。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图9 文本设置
  • PPT PPT界面详情,如图3所示。 图3 PPT界面 PPT界面说明,如表3所示。 表3 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PPTX、PPT和PDF格式的文件上传。 也支持直接拖拽本地文件至文件列表区域,完成上传操作。 操作限制,如下所示: PPT文件不支持超过50页,且文件大小不超过500KB。 如果PPT的字体不支持在MetaStudio控制台展示,建议将PPT转存为PDF文件后再导入。 操作详情请参考PPT如何转为PDF文件?。 如果PPT中有动画、动效,是不支持在MetaStudio控制台展示的,建议将PPT导出为视频后再导入。 操作详情请参考如何在MetaStudio控制台呈现PPT的动画效果?。 界面默认展示两列文件,单击图标后,缩小展示为1列文件。单击图标,可恢复为2列展示。 关键词搜索框,可输入文件名称进行精准搜索。 示例:销售指导书。 文件列表 默认展示全量文件。 查看文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,可以在弹出的界面中预览PPT的所有页面内容。 插入文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,弹出如图4所示的页面,选择文件中的页面完成插入操作。 在视频画面预览区域,如果存在多种视频素材,支持对文件页面进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 删除文件 直接单击文件右下角的图标,执行下述操作: 从下拉框中选择“删除”,删除当前文件。 从下拉框中选择“批量删除”,勾选所有需要删除的文件。单击界面右下角的“删除”,删除选中的所有文件。 文件上传成功后的操作如下所示: 在PPT页签的文件列表区域,单击上传成功的文件,弹出如图4所示的对话框。 图4 插入页面 勾选需要插入的页面或直接全选所有界面,单击“复制当前场景”或“新增场景”,添加至当前视频草稿中。 新增1个视频草稿,默认会有1个场景,用户可以自定义此场景,也可以保持不变。MetaStudio按文件页面依次生成对应的场景,即一个页面对应生成一个场景。 不同的操作的含义为: 复制当前场景:插入的文件页面直接复制第一个场景,粘贴生成新场景,即新场景中完全复用第一个场景的背景、数字人等内容,同时再包含文件的选中页面。 如果插入文件之前,已经有多个场景,需要选中希望复制的场景,去插入文件页面。 新增场景:插入的文件直接复制第一个场景的数字人和背景,其余视频素材效果不会被复制。同时包含文件的选中页面,生成对应的新场景。 如果插入文件之前,已经有多个场景,需要先选中希望的数字人及其背景的场景,再去插入文件页面。 等待所有页面插入完成后,参考视频制作对场景进行定制。
  • 贴图 贴图界面详情,如图5所示。 图5 贴图界面 贴图界面说明,如表4所示。 表4 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。 关键词搜索框,可输入图片名称进行精准搜索。 示例:小贴士。 筛选条件 支持通过素材来源的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。 查看贴图 将鼠标放在图片上方,图片右上角展示图标。单击图标,可查看大图。 插入贴图 将鼠标放在图片上方,图片右上角展示图标。单击图标,添加至当前场景的视频画面中。 在视频画面预览区域,如果存在多种视频素材,支持对贴图进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。
  • 背景 背景界面详情,如图2所示。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 界面默认展示两列图片,单击图标后,缩小展示为1列图片。单击图标,可恢复为2列展示。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 纯色背景 支持设置为透明背景(第一张图),此时不支持添加视频素材,且已添加的素材也会全部清除。 支持设置为纯色背景,可以选择已有的颜色,也可以自定义颜色。 筛选条件 支持通过背景、类型的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 将鼠标放在图片上方,图片右上角展示图标。单击图标,可以将当前图片作为背景替换至所有场景。
  • 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 角色界面默认展示两列数字人,单击图标后,缩小展示为1列数字人。单击图标,可恢复为2列展示。 关键词搜索框,可输入数字人名称进行精准搜索。 示例:yun lan。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域、分辨率和动作的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换更新至视频草稿的所有场景中。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 在视频画面预览区域,如果存在多种视频素材,支持对数字人进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。
  • 解决方法 单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。 图1 工具运行界面 单击“选择webm文件”,选择WEBM格式的视频。 等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的视频名称:test_20240904155004.mov
  • 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 count Integer 视频制作任务总数。 jobs Array of DigitalHumanVideo objects 视频制作任务列表。 表6 DigitalHumanVideo 参数 参数类型 描述 job_id String 任务ID。 state String 任务的状态。 WAITING:等待 PRO CES SING:处理中 SUCCEED:成功 FAILED:失败 CANCELED:取消 start_time String 数字人视频制作开始时间。 end_time String 数字人视频制作结束时间。 duration Float 数字人视频内容时长。 output_asset_config OutputAssetInfo object 输出资产信息。 error_info ErrorResponse object 错误信息。 create_time String 任务创建时间。 lastupdate_time String 任务更新时间。 表7 OutputAssetInfo 参数 参数类型 描述 asset_id String 输出视频资产ID。 asset_name String 输出视频资产名称。 cover_url String 视频封面URL。 preview_video_url String 预览视频下载URL。URL有效期24小时。 说明: 分数数字人视频制作不支持预览。 表8 ErrorResponse 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码: 400 表9 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码: 401 表10 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码: 404 表11 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码: 500 表12 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。
  • 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用 IAM 服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。 X-Project-Id 否 String 使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。 说明: *不允许输入中文。
  • 响应示例 状态码: 200 处理成功返回。 { "count" : 1, "jobs" : [ { "job_id" : "26f06524-4f75-4b3a-a853-b649a21aaf66", "state" : "SUCCEED", "start_time" : "2022-01-18T16:29:36Z", "end_time" : "2022-01-18T16:30:36Z", "duration" : 60, "output_asset_config" : { "asset_id" : "942e65a5fd219a2e01fb08d881cfadb9", "asset_name" : "One Day", "cover_url" : "https://digitalhuman.obs.cn-east-3.myhuaweicloud.com:443/0d697589d98091f12f92c0073501cd79/942e65a5fd219a2e01fb08d881cfadb9/20d367508e62d3d4ad608cedbe81bd35.png?AccessKeyId=XCQKTA8IWQPCAUQS4SDA&Expires=1671241457&Signature=zVGMVbI5ji9rr8epD1Cir5OGIRk%3D" }, "error_info" : null, "create_time" : "2022-11-30T06:59:56Z", "lastupdate_time" : "2022-11-30T07:00:09Z" } ] } 状态码: 400 { "error_code" : "MSS.00000003", "error_msg" : "Invalid parameter" } 状态码: 401 { "error_code" : "MSS.00000001", "error_msg" : "Unauthorized" } 状态码: 404 { "error_code" : "MSS.00000002", "error_msg" : "Not Found" } 状态码: 500 { "error_code" : "MSS.00000004", "error_msg" : "Internal Error" }
  • 请求示例 PUT https://metastudio.cn-north-4.myhuaweicloud.com/v1/70b76xxxxxx34253880af501cdxxxxxx/digital-human-video-scripts/24bad716-87b1-45e5-8912-6102f7693265 { "script_name" : "大自然的传说", "script_description" : "课件", "model_asset_id" : "a5d295cdb345c11bd9f36bc22ced3a7a", "scene_asset_id" : "7ad01cf66f6cc54e45a2021558b7fbb0", "voice_config" : { "voice_asset_id" : "a5d295cdb345c11bd9f36bc22ced3a7a" }, "video_config" : { "codec" : "H264", "bitrate" : 4000, "frame_rate" : "25", "width" : 1920, "height" : 1080 }, "shoot_scripts" : [ { "sequence_no" : 0, "shoot_script" : { "text_config" : { "text" : "大家好,我是云笙" }, "animation_config" : [ { "animation" : "7affc1c9d10b9779957fce7d4aecbd35" } ], "background_config" : [ { "background_type" : "IMAGE", "background_config" : "978f893e1de4553c183b7a805e6290f5" }, { "background_type" : "AUDIO", "background_config" : "b99ac26b53c555c5b89110256197d467" } ] } } ] }
  • 响应参数 状态码: 200 表23 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表24 响应Body参数 参数 参数类型 描述 script_id String 剧本ID audio_files ShootScriptAudioFiles object 用于语音驱动的音频文件上传URL列表。 表25 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表26 ShootScriptAudioFileItem 参数 参数类型 描述 sequence_no Integer 剧本序号。 audio_file_upload_url String 语音驱动音频文件上传URL。创建和更新脚本时返回。单个文件最大100M。支持上传MP3/WAV/M4A文件。 audio_file_download_url String 语音驱动音频文件下载URL。查询脚本详情时返回。 状态码: 400 表27 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码: 401 表28 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 状态码: 500 表29 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。
  • 响应示例 状态码: 400 { "error_code" : "MSS.00000003", "error_msg" : "Invalid parameter" } 状态码: 401 { "error_code" : "MSS.00000001", "error_msg" : "Unauthorized" } 状态码: 500 { "error_code" : "MSS.00000004", "error_msg" : "Internal Error" }