检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
t_id}/copy 复制视频制作剧本 数字人视频制作管理 表4 数字人视频制作管理接口 接口 说明 GET /v1/{project_id}/digital-human-videos 查询视频制作任务列表 分身数字人视频制作管理 表5 分身数字人视频制作管理接口 接口 说明 POST
直播任务管理 用户创建的直播间会以列表的形式,展示在分身视频直播首页面的“直播任务管理”页签中。支持通过直播任务进入直播间,修改直播内容后,重新开播。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。
获取语音文件上传地址 功能介绍 获取语音文件上传地址 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id}/uploading-address-url 表1 路径参数 参数
udios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。 取值范围: 0-3600 默认取值: 0 表12 SmartVideoLayerConfig 参数 是否必选 参数类型 描述 video_url 是 String 视频文件的URL。 video_cover_url
String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。
图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。 表1
通过API合成的视频封面为什么看不到插入的视频素材缩略图? 通过API合成的视频封面,如果看不到插入的视频素材缩略图,是因为创建分身数字人视频制作任务接口未配置image_config参数。详细说明如下所示: 使用创建分身数字人视频制作任务接口插入视频素材时,“layer_typ
String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。
通过API上传的视频和图片素材,为啥视频制作时不可见? 通过API上传的图片和视频,如果在视频制作时不可见,是因为上传资产时未设置system_properties属性,如下所示: 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
udios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。 取值范围: 0-3600 默认取值: 0 表12 SmartVideoLayerConfig 参数 是否必选 参数类型 描述 video_url 是 String 视频文件的URL。 video_cover_url
提交语音训练任务 功能介绍 提交训练任务,执行该接口后,任务会进入审核状态,审核完成后会等待训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数
描述 dx Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920x1080;竖屏(9:16)视频像素为1080x1920。 取值范围: 0-1920 dy Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920x1080;
查询语音训练任务列表 功能介绍 查询语音训练任务列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
声音和形象模型和音视频内容的关系? 声音制作、形象制作和Flexus形象制作得到的模型为模型资产,需要通过视频制作、视频直播和智能交互生成音视频内容,详见功能特性。 声音制作:录制真人声音,建模生成声音模型。 形象制作:拍摄形象采集视频,建模生成数字人形象。 视频制作:使用系统预置
示例5:语音合成管理 语音合成管理示例代码,详见MetaStudio数字人语音合成管理。 父主题: 应用示例
y_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。 取值范围: 0-3600 默认取值: 0 表15 SmartVideoLayerConfig 参数 参数类型 描述 video_url String 视频文件的URL。 video_cover_url
配置特殊词表 支持全局设置自定义读法,设置完成后,所有视频制作剧本自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行自定义读法,如图2所示。