检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。 良好的亮度,确保面部细节。 照片内不能出现多张人脸。 人像照片格式要求,如下所示: 支持的格式为:PNG、JPG、JPEG、WEBP。 大小不超过16MB。
输入的人像照片经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将人像照片输入至算法模型中,通过特征提取、人脸重建、素材特征匹配等进行人头重建,生成3D人头模型。 生成的人头模型通过配上默认身体素材配件,形成完整的3D数字人模型,并返回结果。 算法应用场景
50001015 检测到人脸数量大于1 检测出人脸数量大于1,当前仅支持单人脸照片驱动 请上传只包含一张人脸的图片 200 MSS.50001016 人脸偏转幅度过大,需要正脸图片 输入的照片中人脸偏转幅度不符合限制 请上传正面人脸的照片 200 MSS.50001017 人脸不完整或者非自然人,请检查
视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。 演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。
我的设备不支持拍摄4K视频,只支持拍摄1080P怎么办? 若设备不支持拍摄4K视频,可尝试使用1080P(1080*1920)进行半身拍摄,并确保可以充分捕获人脸区域的细节。 我没有相机,可以用手机拍摄吗? 不建议使用手机拍摄。若实在需要,请将手机录制规格调整为4K、30fps或4K、60fps,并
支持用户最多创建100个技能。 图4 创建技能页面 单击“添加问答”,在页面右侧输入对应的主题、所有问法和数字人回答。 需要注意: “所有问法”最多支持添加500个相似问题,每个问题不能超过64个字符。 一个技能可以最多添加40个问答对。 单击界面右上方的“保存”,界面左侧的“问答列表”中新增一个问答项,示例如图5所示。
如下创建资产时的异常场景,会导致资产被自动置为失败状态。 超过24小时未上传资产主文件。 资产标题、描述和主文件内容审核失败。 服务校验资产主文件与用户创建的文件信息不匹配。 资产冻结说明 资产冻结说明,如表2所示。 表2 资产冻结说明 场景 操作说明 服务冻结租户资产 MetaStudio服务对租户资产内容
相对真人成本下降90%以上 一次拍摄与训练后,可无限次使用;无时间约束、无时长限制、无容量限制;统一质量,稳定性高;口型、动作匹配度高,无限接近真实。 仅分身数字人动作自由度受限于采集视频的动作范围,综合对比数字人比真人成本低、效率高,且质量稳定。 数字人直播更真实、更沉浸 支持持物直播、
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
COUNT:计数 NONE:无处理 默认取值: NONE match String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
单击“保存”,生成视频文件。 视频文件生成后,需要在视频制作界面的“视频”页签,导入使用。 请注意:视频中PPT每页播放的时间如果与对应音频的时长不匹配,需要将完整的PPT视频按页切割成独立的子视频,一一上传至视频制作界面,按场景依次添加使用。添加后的视频支持仅播放一次,或者循环播放,直至音频播报结束。
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
COUNT:计数 NONE:无处理 默认取值: NONE match String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
NONE:无处理 默认取值: NONE match 否 String 参数解释: 匹配类型。关键词匹配建议使用REGEX。 约束限制: 不涉及。 取值范围: EQUAL: 完全相等 REGEX:正则匹配 MATH_GT:数值大于 MATH_GE:数值大于等于 MATH_LT:数值小于
认证失败,token为空 认证失败,token过期 token和租户id不匹配 请检查携带的鉴权信息 对应处理方式如下所示: 请参考认证鉴权获取token。 请参考认证鉴权重新获取token。 重新获取与token匹配的项目ID,详见获取项目ID。 403 MSS.000000004 非法访问,未鉴权或者鉴权失败
match the selected application type. 检测到您当前配置的是星火大模型,与所选应用类型不匹配,请检查应用类型与应用信息是否匹配 MSS.47015009 AIUI application you configured does not match the
传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 请选择原始输入语言 上传语料所使用的语言。 包含19种语言:中文、英文、粤语、德语、法语、土耳
分身数字人智能交互 支持购买多路,每路按时长计费。 须知: 智能交互中数字人分身的动作是根据数字分身拍摄形象训练生成的,唇形和文字声音匹配,数字分身和背景融合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型