检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3倍以上。在数字人模型生成以后,可以通过模型驱动推理服务,让数字人动起来,包括声音、表情、口型、肢体动作等,口型匹配准确率>95%,表情、动作更自然。 直播话术智能生成:基于十万
数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。 功能详情,如表1所示。
可。注意要保证脸部和身体没有出现明显的阴影。在灯光设备有限的情况下,优先打亮被拍摄主体,之后再去对绿幕进行补光。 收音 我们会使用视频中的语音和您口型变化的对应关系来训练口型驱动效果,训练结果还会经过专家的技术审核。 因此在收音这方面,我们建议: 保证视频音画同步。 确保环境安静
PICTURE_MODELING:照片建模生成的模型 CHARACTER_CUSTOMIZATION_MODELING:捏脸生成的模型 默认取值: UPLOADED modeling_job_id String 参数解释: 建模任务ID。 约束限制: 仅由MetaStudio服务生成的模型系统自行填写 取值范围:
“算法训练完成”,如图2所示。 查看生成的分身数字人形象是否满足。用户可以在“定制任务详情”界面,执行下述操作。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。
资产范围说明 用户资产如下所示: 一类是使用MetaStudio控制台功能生成的,如下所示: 用户在控制台进行形象制作,生成的数字人形象,会展示在“我的创作 > 分身形象”页面。 用户在控制台进行声音制作,生成的声音,会展示在“我的创作 > 声音”页面。 用户在控制台进行视频制作,合成的视频,会展示在“我的创作
play_mode 否 String 参数解释: 驱动方式。 约束限制: 不涉及。 取值范围: TEXT:文本驱动,即通过TTS合成语音。 AUDIO:语音驱动。 NO_PRESET:无预置剧本,人工控制模式。 默认取值: TEXT random_play_mode 否 String
单击“下一步”,进入“文档清洗”页面,如图5所示。 参数配置说明,如表1所示。 图5 文档清洗 表1 参数说明 参数 说明 分段设置 选择文字分段的方式。 包含如下选项: 自动分段:自动对文档进行分段处理。单击“自动分段”,“分段预览”区域会展示自动分段后的文本效果。 手动分段:
敏感词话术 数字人回复内容触发敏感信息时,使用的回复话术。 示例:哎呦,这个问题我没有听懂哦!请您重新提问。 单击“在线演示”,可以在界面右侧演示模型对话效果,如图4所示。 图4 在线演示 单击界面右上角的“保存”,在弹出的“保存成功”提示框中,单击“确定”。 角色创建完成。 查看角色信息
查看视频 如果用户需要查看已生成的照片数字人视频,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。
热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String
recognition unavailable for this language. Try with another language. 当前选择的语言不支持语音识别,请切换语言后重新尝试。 MSS.47010144 Switch to text mode and try again. 当前非文本模式,请切换至文本对话模式后再尝试
声音配置信息,为Flexus版声音的配置项,标准版声音不支持此配置。 supported_service 否 Array of strings 该任务所生成的模型支持的业务类型,可多选。 Flexus版数字人仅支持选择“VIDEO_2D”。 默认取值: [VIDEO_2D,LIVE_2D] 表4
创建照片建模任务 功能介绍 该接口用于创建风格化照片建模任务。使用BASE64编码照片,通过JSON格式上传,生成风格化数字人模型。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings-by-json
fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。
创建照片建模任务 功能介绍 该接口用于创建风格化照片建模任务。通过上传照片,生成风格化数字人模型。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human/stylized/picture-modelings 表1 路径参数
fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。
fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。
fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。
fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。