检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数解释: 字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size Integer 参数解释: 字体大小。接口的取值范围为0-120,实际业务使用的取值范围要求为24-120,请以业务实际使用要求为准。
复制视频制作剧本 功能介绍 该接口用于复制视频制作剧本。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-video-scripts/{script_id}/copy 表1 路径参数 参数 是否必选 参数类型 描述
MetaStudio平台仅支持上传通过PPT转存的PDF文件,不支持使用Adobe导出的PDF文件。 PPT转PDF的操作如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 另存为”。 选择另存的文件类型:PDF。 单击“保存”,生成PDF文件。 PDF文件生成后,可以导入视频制作界面使用。 父主题:
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 视频制作剧本 一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。
复制当前场景:插入的文件页面直接复制第一个场景,粘贴生成新场景,即新场景中完全复用第一个场景的背景、数字人等内容,同时再包含文件的选中页面。 如果插入文件之前,已经有多个场景,需要选中希望复制的场景,去插入文件页面。 新增场景:插入的文件直接复制第一个场景的数字人和背景,其余视频
BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config 是 BusinessCardImageConfig object 用户上传的用于制作数字人名片的图片。 introduction_type 否
工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的视频名称:test_20240904155004.mov 父主题: 视频制作
查询数字人名片制作任务详情 功能介绍 该接口用于查询数字人名片制作任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述
删除数字人名片制作任务 功能介绍 该接口用于删除数字人名片制作任务。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述
形象制作和声音制作支持退订吗? 形象制作和声音制作均为一次性计费产品,不支持退订,用户购买前需谨慎评估。 如果是软件问题导致模型效果不理想,可提交工单申请退订产品。产品经理会对实际情况进行核实,对满足条件的发起特殊退订操作。 父主题: 计费咨询
通过单张照片生成视频 说明: 该参数已废弃,照片数字人视频制作使用“创建照片分身数字人视频制作任务”接口。 human_image String 人物照片,需要Base64编码。 说明: 该参数已废弃,照片数字人视频制作使用“创建照片分身数字人视频制作任务”接口。 model_asset_id String
视频制作 上传图片时提示像素超标怎么办? 贴图支持动态图片吗? PPT如何转为PDF文件? 如何呈现PPT的动画效果? PPT文件解析失败,无法上传怎么办? 上传的PPT支持编辑吗? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? 合成的视频可以下载至本地吗? 合成视频二次剪辑后,数字人口型效果变差?
音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。 5 文件设置区域 从左往右依次为: 单击文件名称右侧的图标,可自定义视频制作剧本的名称。 单击图标,保存视频制作任务。
字体。当前支持的字体请参考服务支持的字体 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: HarmonyOS_Sans_SC_Black font_size Integer 参数解释: 字体大小(像素)。接口的取值范围为0-120,实际业务使用的取值范围要求为4-120,请以业务实际使用要求为准。
创建照片检测任务 功能介绍 该接口用于创建照片检测任务,检测照片是否满足制作照片数字人的要求。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/photo-detection 表1 路径参数 参数 是否必选 参数类型 描述 project_id
请您检查待合成视频中选择的素材是否均已激活。如果未激活,可能原因如下所示: 视频中使用的素材未上传成功,需重新上传后使用。 视频中的素材已被删除,多数情况下为PPT素材。需要在“我的创作 > 回收站”界面,找到素材并恢复。 视频中的素材可能涉及敏感内容,在“我的创作 > 资源 > 已
视频制作 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人视频制作功能。 建模示例 详情请参考数字人视频制作。
单击“声音制作”下方的“开始创建”,进入声音制作页面。 选择“第三方模型”页签的“出门问问声音制作”方式。 界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0
练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。 进阶版:整段录制生成一个WAV或MP3格式音频,总时长10~30分钟,建议15分钟。
声音制作限制 声音制作限制说明,如表1所示。 表1 声音制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音