检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。 音频驱动 每个单场景上传音频的大小不超过100M。 视频格式 插入的视频素材支持的格式
否 VoiceConfig object 语音配置参数。 说明: *此参数将被废弃,请使用voice_config_list。 voice_config_list 否 Array of ChatVoiceConfig objects 语音配置参数列表。 robot_id 否 String
视频制作 上传图片时提示像素超标怎么办? 贴图支持动态图片吗? PPT如何转为PDF文件? 如何呈现PPT的动画效果? PPT文件解析失败,无法上传怎么办? 上传的PPT支持编辑吗? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? 合成的视频可以下载至本地吗? 合成视频二次剪辑后,数字人口型效果变差?
文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config TextConfig object 讲解词配置。 audio_drive_action_config Array of AudioDriveActionConfig objects 语音驱动时的动作配置。
定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 使用“语料上传”方式上传语音文件前,需参考声音制作页面的“录音指导”,提前录制好音频。 声音授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。
剧本封面下载url。 script_type String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 text String 台词脚本。 create_time String 创建时间,格式遵循:RFC 3339 如"2021-01-10T08:43:17Z"。
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 robot_id 是 String 应用ID。 sis_hot_words 是 CreateSisHotWords
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 sis_hot_words 是 UpdateSisHotWords object sis类型热词 表4 UpdateSisHotWords
否 VoiceConfig object 语音配置参数。 说明: *此参数将被废弃,请使用voice_config_list。 voice_config_list 否 Array of ChatVoiceConfig objects 语音配置参数列表。 robot_id 否 String
voice_config VoiceConfig object 语音配置参数。 说明: *此参数将被废弃,请使用voice_config_list。 voice_config_list Array of ChatVoiceConfig objects 语音配置参数列表。 robot_id String
Boolean 动作是否需要自动解析。 默认取值: false voice_delay 否 Float 语音延迟播放时长。 单位秒。 使用场景举例:入场动画3秒,voice_delay设置成4秒,则语音从入场动画开始后第4秒开始播放。 取值范围: 0-100 默认取值: 0 animation_insert_restriction
结束命令。 直播平台的规定及相关政策请自行了解,部分平台可能限制虚拟内容直播。 常见问题 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事? 父主题: 附录
CBS:对话机器人服务(CBS)访客 SIS:语音交互服务(SIS)调用 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取
CBS:对话机器人服务(CBS)访客 SIS:语音交互服务(SIS)调用 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
CBS:对话机器人服务(CBS)访客 SIS:语音交互服务(SIS)调用 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取
is_end_at_first_frame 否 Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表5 SubtitleConfig
object 视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_video_type String 智能交互对话端配置。 COMPUTER: 电脑端 MOBILE: 手机端 HUB:
声音和形象制作 标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
安卓手机的超级录音机的录音参数设置方式,如下所示: 打开超级录音机软件。 为了能正常录音和保存文件,需要先授权给软件录音和存储权限,即允许“超级录音机”访问媒体。 进入软件设置页面。 设置如下选项: 录制设置 > 录音音质:选择“高清”。 录制设置 > 录音保存格式:选择“WAV”或“MP3”。