检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:flexus版本资源 sub_resource_type String 子资源类型。当前只有flexus套餐包存在该字段 voice_clone_flexus: 语音克隆Flexus版 modeling_co
background_music_config 否 BackgroundMusicConfig object 背景音乐配置。 说明: 仅分身数字人视频制作设置背景音乐;3D数字人视频制作不支持设置背景音乐。 review_config 否 ReviewConfig object 内容审核配置 shoot_scripts
permission denied. 未授权音频设备采集权限,采集失败。建议用户授权麦克风访问权限。 90100018 capture failed, Constraint parameter invalid. 音频采集设备不支持设置的采集约束,采集失败。 90100019 capture
object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人在
object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人
object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人
视频直播 直播剧本保存失败怎么办? 提示模板不可用怎么办? 直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?
model_infos ModelInfo object 数字人模型信息 voice_config VoiceConfig object 语音配置参数。 说明: *此参数将被废弃,请使用voice_config_list。 concurrency Integer 参数解释: 并发路数。
文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config TextConfig object 讲解词配置。 audio_drive_action_config Array of AudioDriveActionConfig objects 语音驱动时的动作配置。
文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config TextConfig object 讲解词配置。 audio_drive_action_config Array of AudioDriveActionConfig objects 语音驱动时的动作配置。
一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。 音频驱动 每个单场景上传音频的大小不超过100M。 视频格式 插入的视频素材支持的格式
object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人
用户如何举报平台违规内容? 如何集成MetaStudio服务? 如何调用MetaStudio接口? 数字人相关问题 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
视频制作 上传图片时提示像素超标怎么办? 贴图支持动态图片吗? PPT如何转为PDF文件? 如何呈现PPT的动画效果? PPT文件解析失败,无法上传怎么办? 上传的PPT支持编辑吗? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? 合成的视频可以下载至本地吗? 合成视频二次剪辑后,数字人口型效果变差?
剧本封面下载url。 script_type String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 text String 台词脚本。 create_time String 创建时间,格式遵循:RFC 3339 如"2021-01-10T08:43:17Z"。
object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人
定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 使用“语料上传”方式上传语音文件前,需参考声音制作页面的“录音指导”,提前录制好音频。 声音授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。
结束命令。 直播平台的规定及相关政策请自行了解,部分平台可能限制虚拟内容直播。 常见问题 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事? 父主题: 附录
BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
Boolean 动作是否需要自动解析。 默认取值: false voice_delay 否 Float 语音延迟播放时长。 单位秒。 使用场景举例:入场动画3秒,voice_delay设置成4秒,则语音从入场动画开始后第4秒开始播放。 取值范围: 0-100 默认取值: 0 animation_insert_restriction