正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
若对素材进行后处理,导出时请确保帧率与原视频一致。 时长 视频时长通常为5~6分钟。请勿剪辑视频长度,确保讲述视频、静默、手势,一并导出至同一个视频中。 美颜 如需对视频进行美颜等处理,需在美颜完成后,确认视频画质不存在变形、模糊或晃动等情况,再提交训练视频。 裁剪 在指定时长内,需要确保主播全身入镜,
Integer 参数解释: 图片显示时长,单位s。 显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。 取值范围: 0-3600 默认取值: 0 表12 SmartVideoLayerConfig
进行智能交互时,透明背景支持的浏览器及其版本,详见客户端SDK参考-快速入门-表3。 对话 配置对话,可以设置数字人欢迎语和热点问题,方便用户与数字人进行交互问答。执行对话配置前,需要完成应用创建操作。 配置对话的详细操作,如下所示: 登录MetaStudio控制台,单击“智能交互”,如图3所示。
“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值与前一条通知的内容是上下衔接关系。例如:第一条通知的text为“你吃”,第二条新返回了“饭了么”,则第二条text值为“饭了么”,需要将两条通
Integer 参数解释: 图片显示时长,单位s。 显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。 取值范围: 0-3600 默认取值: 0 表15 SmartVideoLayerConfig
大小不超过16MB。 分辨率最大支持1080P,如果超出,会自动缩放为1080P。 音频 音频录制要求,如下所示: 单声道音频。 清晰人声无背景音乐与杂音。 音频格式要求,如下所示: 支持的格式为:MP3、WAV。 大小不超过20MB,时长不超过5分钟。 文本驱动 文本驱动方式的要求如下所示:
3D数字人语音驱动 创建语音驱动任务 获取语音驱动任务列表 创建语音驱动表情动画任务 获取语音驱动表情数据 获取语音驱动数据 父主题: 3D数字人
宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频,推荐MP4格式。 训练生成的分身数字人形象与真人形象完全相同。 声音制作语料类型 Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。
目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后的语言保持一致。如果语言选择英文,声音选择中文声音,那么界面交互时数字人会没有声音。 图2 配置对话 图3 选择声音 语言和声音设
目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后的语言保持一致。如果语言选择英文,声音选择中文声音,那么界面交互时数字人会没有声音。 图2 配置对话 图3 选择声音 语言和声音设
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
backup_model_asset_ids 否 Array of strings 参数解释: 主播轮换时备选主播数字人资产ID(仅形象资产,不包含声音)。 约束限制: 不涉及 取值范围: 当前最大支持5个备选主播。 数字人资产ID,字符长度0-64位。 默认取值: 不涉及 live_event_callback_config
服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权。 408 Request Timeout 服务器等候请求时发生超时。 客户端可以随时再次提交该请求而无需进行任何更改。
相机架设及拍摄规格 相机架设 建议选用与40mm-85mm焦距等效的镜头,避免使用超广角。 在合适的高度,将相机竖置并固定于三脚架上,确保水平。 相机与人物眼神平齐,并对焦于模特面部区域,确保面部清晰不失焦。 若录制模特全身,请确保模特脚底有绿幕空隙。 图1 拍摄示例 建议使用相机竖拍。
让您可以轻松体验畅快无比的运行速度和极致的使用感受。 这款家用机器人具备稳定的电力供应和支持系统。 这款家用机器人还具备精细化的动作控制与执行能力。 无论是行走、搬运物品还是执行其他动作,机器人都能轻松应对。 这款家用机器人还采用了超高清显示技术,带给您细腻的色彩和清晰度。 无
干扰。 模特 面部 避免面部过油导致反光。 确保面部无零散发丝。 尽量不佩戴眼镜,以免反光。 保证模特轮廓清晰,精神饱满。 着装 避免穿着与绿幕颜色相近的服饰,避免衣服上带绿色图案。 不佩戴可能反光的金属耳饰、手链和手表。 体态动作 面带微笑。头部自然摆动,动作自然,避免幅度过大
如下创建资产时的异常场景,会导致资产被自动置为失败状态。 超过24小时未上传资产主文件。 资产标题、描述和主文件内容审核失败。 服务校验资产主文件与用户创建的文件信息不匹配。 资产冻结说明 资产冻结说明,如表2所示。 表2 资产冻结说明 场景 操作说明 服务冻结租户资产 MetaStud
backup_model_asset_ids Array of strings 参数解释: 主播轮换时备选主播数字人资产ID(仅形象资产,不包含声音)。 约束限制: 不涉及 取值范围: 当前最大支持5个备选主播。 数字人资产ID,字符长度0-64位。 默认取值: 不涉及 live_event_callback_config
确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以结构化格式(如JSON或XML)返回,与响应消息头中Content-Type对应,传递除响应消息头之外的内容。 对于管理员创建IAM用户接口,返回如下消息体。为篇幅起见,这里只展示部分内容。