检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄,人物须
创建高级版语音训练任务 查询语音训练任务列表 提交语音训练任务 查询语音训练任务详情 删除语音训练任务 查询任务操作日志 获取语音文件上传地址 获取语音训练任务审核结果 设置任务批次 确认在线录音结果 获取在线录音确认结果
参数 是否必选 参数类型 描述 face_addr 否 String 面部表情输入地址。 body_addr 否 String 身体动作输入地址。 audio_addr 否 String 音频输入地址。 session_id 否 Integer 会话ID。 取值范围: 0-4294967295
job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE: 女性 MALE: 是男性 language String 语言。 state
音字的发音或英文单词发音。 语法 1 2 <phoneme ph="string">文字</phoneme> The <phoneme ph="W EH1 DH AH0">weather</phoneme> is very good. 属性 表2 属性说明 属性名称 属性类型 属性值
响应Body参数 参数 参数类型 描述 job_id String 任务ID。 name String 分身数字人模型名称。该名称会作为资产库中分身数字人模型资产名称。 state String 任务的状态。 与MetaStudio Console上用户看到的状态映射关系如下: 待提交
问题定位及修改 错误提示 处理办法 视频名称包含非法字符 请您根据要求修改导出文件名称中的敏感字符。 资产名称重复 请您根据要求重新修改导出文件的名称。 视频任务合成状态一直显示“待合成” 可能是由于当前视频任务正在等待队列中,请您耐心等待。 演示素材不存在或不可用 请您检查待合成视频中选
getInstance("MD5"); FileInputStream fileInputStream = new FileInputStream("文件地址"); BufferedInputStream bufferedInputStream = new BufferedInp
String 图片URL style_id 是 String 风格ID name 是 String 模型名称 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id
02 system_female_002:女性风格02 name 是 String 数字人模型名称,首次创建时使用。 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id
任务ID。 websocketAddr string | undefined 智能交互服务端websocket地址,三方驱动场景用来拼接websocket链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4
所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。
OutputInfo 参数 参数类型 描述 face_addr String 面部表情输入地址。 body_addr String 身体动作输入地址。 audio_addr String 音频输入地址。 session_id Integer 会话ID。 取值范围: 0-4294967295
OutputInfo 参数 参数类型 描述 face_addr String 面部表情输入地址。 body_addr String 身体动作输入地址。 audio_addr String 音频输入地址。 session_id Integer 会话ID。 取值范围: 0-4294967295
String 请求ID。 表4 响应Body参数 参数 参数类型 描述 robot_id String 应用ID。 name String 应用名称。 room_id String 智能交互对话房间ID。 app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。
视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的视频名称:test_20240904155004
例推荐16:9或9:16。 视频名称 使用照片人像合成视频名称。 02 录入播报内容 选择一种方式,生成播报内容 提供下述种方式,生成照片数字人播报内容。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。
一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域上方的图标,切换视频画面比例为横屏“16:9”或竖屏“9:16”。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
objects 应用信息 表6 RobotInfo 参数 参数类型 描述 robot_id String 应用ID。 name String 应用名称。 room_id String 智能交互对话房间ID。 app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。
文件上传成功后的操作如下所示: 在PPT页签的文件列表区域,单击上传成功的文件,弹出如图4所示的对话框。 图4 插入页面 勾选需要插入的页面或直接全选所有界面,单击“复制当前场景”或“新增场景”,添加至当前视频制作剧本中。 新增1个视频制作剧本,默认会有1个场景,用户可以自定义此场景,也可以保持不变。