检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
的视频画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图9所示。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图9 文本设置 父主题: 视频制作
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
稿一:华为云MetaStudio介绍 基于盘古数字人大模型,华为云MetaStudio打造了一站式、全流程的数字人直播服务,通过高效的训练和推理服务,重塑千行百业的电商直播。 数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3
视频直播 视频直播界面说明 视频直播 互动管理 商品管理 直播任务管理 智能交互设置 视频直播公共配置
is_end_at_first_frame 否 Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表5 SubtitleConfig
IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 表5 ProductTextInfo 参数 是否必选 参数类型
system_female_002:女性风格02 name 是 String 数字人模型名称,首次创建时使用。 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5
本根节点。 <break/>标签用于静音停顿,可设置停顿时长。 <phoneme></phoneme>标签,用于标记多音字发音。 <say-as></say-as>标签用于指定数字或英文的读法。 <sub></sub>标签用于设置当前标记文字的别名,即替代读法。 <prosody
is_end_at_first_frame Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表7 SubtitleConfig
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
Flexus分身数字人形象采集指南 本节将协助您完成Flexus分身数字人形象的采集工作。请注意,您的数字人形象会与录制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。
is_end_at_first_frame Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表6 SubtitleConfig
智能交互对话端配置。 COMPUTER: 电脑端 MOBILE: 手机端 HUB: 大屏 chat_access_address String 智能交互接入地址。 is_transparent Boolean 是否透明背景 默认取值: false default_language String 默认语言,智能交互接口使用。默认值CN。
is_end_at_first_frame Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表10 SubtitleConfig
cn-north-4: 北京4 cn-southwest-2: 贵阳1 chat_access_address String 智能交互接入地址。 is_transparent Boolean 是否透明背景 默认取值: false default_language String 默认语言,智能交互接口使用。默认值CN。
修订记录 表1 修订记录 修改时间 修改说明 2024-12-30 第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05
style_id 是 String 风格ID name 是 String 模型名称 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5
String 第三方语言模型应用ID。 app_key 否 String 第三方语言模型应用密钥。 llm_url 否 String 第三方语言模型地址。 is_stream 否 Boolean 是否采用流式响应。 默认取值: false chat_rounds 否 Integer 支持的
示例:分身数字人形象制作。 请选择资源实例 从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作 - 2025-11-01。 请选择资源数量 设置资源数量,不能超过所选资源实例已激活的数量。 示例:2。 请选择日期 资源激活后,从激活日期开始计算,有效期是一年。这里选择的日期,为有效期内的时间。