检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分身数字人定制任务提交后,审核未通过怎么办? 如果提示信息为“自动审核不通过-人证不匹配”,可能原因如下所示: 人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。
用户进行问答。可通过界面右上方的语言切换图标,切换语言。 声音:单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,英文语言则选择对应的英文声音,否则数字人表达会有问题。 图1 对话配置 父主题: 智能交互
COUNT:计数 NONE:无处理 默认取值: NONE match String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
单击“保存”,生成视频文件。 视频文件生成后,需要在视频制作界面的“视频”页签,导入使用。 请注意:视频中PPT每页播放的时间如果与对应音频的时长不匹配,需要将完整的PPT视频按页切割成独立的子视频,一一上传至视频制作界面,按场景依次添加使用。添加后的视频支持仅播放一次,或者循环播放,直至音频播报结束。
如下创建资产时的异常场景,会导致资产被自动置为失败状态。 超过24小时未上传资产主文件。 资产标题、描述和主文件内容审核失败。 服务校验资产主文件与用户创建的文件信息不匹配。 资产冻结说明 资产冻结说明,如表2所示。 表2 资产冻结说明 场景 操作说明 服务冻结租户资产 MetaStudio服务对租户资产内容
match the selected application type. 检测到您当前配置的是星火大模型,与所选应用类型不匹配,请检查应用类型与应用信息是否匹配 MSS.47015009 AIUI application you configured does not match the
认证失败,token为空 认证失败,token过期 token和租户id不匹配 请检查携带的鉴权信息 对应处理方式如下所示: 请参考认证鉴权获取token。 请参考认证鉴权重新获取token。 重新获取与token匹配的项目ID,详见获取项目ID。 403 MSS.000000004 非法访问,未鉴权或者鉴权失败
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
MSS.47010208 应用类型与应用信息不匹配 应用类型与应用信息不匹配 应用类型与应用信息不匹配,确认是否需要使用星火类型 400 MSS.47010209 应用类型与应用信息不匹配 应用类型与应用信息不匹配 应用类型与应用信息不匹配,确认是否需要使用AIUI类型 400 MSS
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
glish情景模式,详见创建智能交互数字人(科大讯飞)。 声音 单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,否则数字人表达会有问题。 还可以根据实际情况,设置语速、音量和音高。 语速:设置语速,取值范围[0.5X,2X]。设置为0
COUNT:计数 NONE:无处理 默认取值: NONE match String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
生成数字人、数字物、数字空间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:AI眼神纠正,持续眼神交流,细节更丰富。 图像真实:智能重打光,背景融合更真实。 多种
模型,生成效率相比业界提升3倍以上。在数字人模型生成以后,可以通过模型驱动推理服务,让数字人动起来,包括声音、表情、口型、肢体动作等,口型匹配准确率>95%,表情、动作更自然。 直播话术智能生成:基于十万级高质量直播话术的预训练,自动生成专业话术,精准驱动数字人准确、流利地介绍产品,让每个人都能成为专业的主播。
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
拍摄,提升视频内容生产效率。 算法目的意图 可以使用授权过的真人视频,在预训练模型基础上,生成真人数字人驱动模型。该模型可基于音频生成口型匹配的数字人视频,实现真人视频自动生成,包括新闻播报、课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。 华为云MetaStudio分身数字人声音制作算法
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于