检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
f37118098b CertUtil: -hashfile 命令成功完成。 参考表1,下载SDK安装包完整性校验文件至本地。 使用文本编辑器打开完整性校验文件,查看文件中的SHA256值和2中生成的SHA256值是否一致。 如果一致,说明SDK安装包下载过程中,不存在篡改和丢包现象。
上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。
工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的
查询知识库问法列表 功能介绍 该接口用于查询知识库问法列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/question 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询数字人名片制作任务列表 功能介绍 该接口用于查询数字人名片制作任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-business-cards 表1 路径参数 参数 是否必选 参数类型 描述 project_id
nage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 job_id 是 String 任务ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型
ture-modelings/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 job_id 是 String 任务ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0.5~180分钟,建议5分钟。音频格式为WAV或MP3文件,支持19种语言的声音制作。 音频总时长,建议5分钟;单段不低于5秒
直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
查询知识库意图列表 功能介绍 该接口用于查询知识库意图列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/intent 表1 路径参数 参数 是否必选 参数类型 描述 project_id
资产范围说明 用户资产如下所示: 一类是使用MetaStudio控制台功能生成的,如下所示: 用户在控制台进行形象制作,生成的数字人形象,会展示在“我的创作 > 分身形象”页面。 用户在控制台进行声音制作,生成的声音,会展示在“我的创作 > 声音”页面。 用户在控制台进行视频制作,合成的视频,会展示在“我的创作
取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer 参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值:
取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer 参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值:
数字人视觉驱动算法是指使用神经网络,将视频中的人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据的一种技术。 其基本情况包括: 输入数据:单人表演视频。 算法原理:通过深度学习算法识别人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据。 输出结果:表情基系数、数字人骨骼驱动数据。
10001025 {0}类型文件不存在 {0}类型文件不存在 使用正确的文件类型 400 MSS.10001026 {0}类型文件已存在 {0}类型文件已存在 使用正确的文件类型 400 MSS.10001027 {0}类型文件超过{1}个 {0}类型文件超过{1}个 使用正确的文件类型 400
无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动 能呈现自定义表情&动作 剧本、画布和设置 视频制作、视频直播功能,都需要进行
内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 不同声音对表1中操作的支持情况有差异。如果表1中操作项置灰,说明当前选择的声音不支持此操作。需要重新选择一个支持所需操作的声音模型,进行文本驱动设置。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文
String 文件下载URL,有效期为24小时。 state String 文件状态枚举: CREATING:文件上传中 CREATED:文件已上传(自动审核通过) FAILED:文件上传失败 CANCELLED:文件上传已取消 DELETING:文件删除中 DELETED:文件已删除