检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
拍摄完成后请提交一个视频素材。 推荐视频格式为MP4。 视频大小通常小于5G。 提交训练的视频需要保留录制时的原声。 若对素材进行后处理,导出时请确保帧率与原视频保持一致。 时长 视频时长通常为5~6分钟。请勿剪辑视频长度,确保讲述视频、静默、手势,一起导出至同一个视频中。 美颜
饰或者镜面首饰可能造成反光影响到最后的背景分割效果。 第二步,我们需要拍摄一段5分钟的4K绿幕视频,在视频刚开始的15-20秒内,需要找到一个舒服的姿势并保持静默,静默时需要闭上嘴巴。静默期结束后,就可以开始自由演讲,可以阅读华为提供的示例文案,也可以不看提词器自由发挥,通常自由
过滤创建时间<=输入时间的记录。 create_since 否 String 过滤创建时间>=输入时间的记录。 state 否 String 任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=FAILED,WAITING job_id 否 String 任务id。 voice_name
频,推荐MP4格式。 训练生成的分身数字人形象与真人形象完全相同。 声音制作语料类型 Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。 单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格
是否必选 参数类型 描述 relation 否 String 参数解释: 条件关系。对于多个条件的逻辑运算关系。 约束限制: 不涉及。 取值范围: AND:表示多个条件同时满足。 OR:表示多个条件满足其一即可。 RESERVED:兜底回复不会去判断其他命中条件。 默认取值: 不涉及。
Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 CustomPlatformAuthConfig 参数 是否必选 参数类型 描述 key 是 String 密钥Key。调用自定义直播平台时使用。
Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 UpdateCustomPlatformAuthConfig 参数 是否必选 参数类型 描述 key 否 String
是否必选 参数类型 描述 relation 否 String 参数解释: 条件关系。对于多个条件的逻辑运算关系。 约束限制: 不涉及。 取值范围: AND:表示多个条件同时满足。 OR:表示多个条件满足其一即可。 RESERVED:兜底回复不会去判断其他命中条件。 默认取值: 不涉及。
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
色ID。 图1 查询音色ID 使用接口查询自研音色ID 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。
HitCondition 参数 参数类型 描述 relation String 参数解释: 条件关系。对于多个条件的逻辑运算关系。 约束限制: 不涉及。 取值范围: AND:表示多个条件同时满足。 OR:表示多个条件满足其一即可。 RESERVED:兜底回复不会去判断其他命中条件。 默认取值: 不涉及。
单击新增应用所在行的图标,进入“应用配置”页面。 图16 应用配置页面 单击界面最上方的“情景模式”右侧的“+”图标,弹出“新增情景模式”对话框。 一个应用可以增加多个情景模式,每个情景模式相互独立,互不干扰。 参数配置说明,如下所示: 情景模式名称:必须配置为“English”。 保持“语音语义”不变。
回答。 需要注意: “所有问法”最多支持添加500个相似问题,每个问题不能超过64个字符。 一个技能可以最多添加40个问答对。 单击界面右上方的“保存”,界面左侧的“问答列表”中新增一个问答项,示例如图5所示。 图5 添加问答 请参考7~8,依次录入所有问答。 单击界面右上方的“
LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecognized分别为问题和答案,每轮问答共用一个chatId。 error 【事件说明】 在业务异常时,返回的错误事件。 【回调参数】 icsError:IcsError类型。字段定义如表2所示。
Query参数 参数 是否必选 参数类型 描述 resource 否 String 资源类型。可填多个,用","分隔。详见资源类型。 business 否 String 业务类型。可填多个,用","分隔。 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理
不开启 默认取值: false is_end_at_first_frame 否 Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持。 取值范围 true: 开启 false: 不开启 默认取值:
一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的视频名称:test_20240904155004
HitCondition 参数 参数类型 描述 relation String 参数解释: 条件关系。对于多个条件的逻辑运算关系。 约束限制: 不涉及。 取值范围: AND:表示多个条件同时满足。 OR:表示多个条件满足其一即可。 RESERVED:兜底回复不会去判断其他命中条件。 默认取值: 不涉及。
AI在医疗领域的应用发展迅速。 比如,AI图像识别技术可以帮助医生提高疾病诊断的准确性和效率,也可以帮助医疗机构改善资源利用和服务质量。 中国继续推进5G网络建设,多个城市已经实现5G商用覆盖。 5G技术带动了智能制造、自动驾驶、虚拟现实等应用的发展。 中国政府支持新能源汽车的发展和普及,限制燃油车并推行减排政策。
是否必选 参数类型 描述 relation 否 String 参数解释: 条件关系。对于多个条件的逻辑运算关系。 约束限制: 不涉及。 取值范围: AND:表示多个条件同时满足。 OR:表示多个条件满足其一即可。 RESERVED:兜底回复不会去判断其他命中条件。 默认取值: 不涉及。