检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。
}); 表1中导入的图片使用SDK默认方式时,在智能交互页面的展示效果,如图1所示。 图1 SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRe
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
PPT如何转为PDF文件? 如何呈现PPT的动画效果? PPT文件解析失败,无法上传怎么办? 上传的PPT支持编辑吗? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? 合成的视频可以下载至本地吗? 合成视频二次剪辑后,数字人口型效果变差? 如何生成视频制作模板?
资产管理 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人资产管理功能。 建模示例 详情请参考资产管理。
纹的衣服。我们需要确保面部没有零散的发丝,尽量不要佩戴眼镜或者项链、耳环、手表等首饰。因为银饰或者镜面首饰可能造成反光影响到最后的背景分割效果。 第二步,我们需要拍摄一段5分钟的4K绿幕视频,在视频刚开始的15-20秒内,需要找到一个舒服的姿势并保持静默,静默时需要闭上嘴巴。静默
视频直播 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人直播功能。 建模示例 详情请参考数字人直播。
数字人名片制作 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人名片制作功能。 建模示例 详情请参考数字人名片制作。
视频制作剧本管理 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人视频制作剧本管理功能。 建模示例 详情请参考视频制作剧本管理。
视频制作 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人视频制作功能。 建模示例 详情请参考数字人视频制作。
教学和培训,不仅可以大幅节约师资成本,还可以提升教学质量。通过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学内容的优化上,从而实现更高效的教育体系。 医疗健康 医学科普是近年来政策倡导的一大方向。通过医学科普,对改善已患病人群的术后身心健康等问题起着关键作用。以视频形
M。 说明: 在视频制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 插入的视频素材,要求如下所示: 分辨率最大支持1080P。
选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单击“视频制作”,基于已有声音,进行视频制作,操作请参考视频制作。 单击“视频直播”,基于已有声音,制作视频直播,操作请参考视频直播。
多的段落。 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎
exus声音进行视频合成。 试听 单击“试听”,试听语音效果。 生成预览 单击“生成预览”,选择“当前场景”或“所有场景”,以预览其对应的音频和字幕播放效果。 须知:预览视频为静态页面,需合成视频后,才能查看视频动态播放效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。
过直播间任务进入直播间,修改直播间内容后,重新开播。操作请参考直播任务管理。 直播平台对接:用户新增第三方平台配置,可以关联至直播间使用,实现MetaStudio对接第三方直播平台。操作请参考直播平台对接。 直播配置:租户级配置,包括直播最长时长、异常重连和直播中断通知。操作请参考直播配置。
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考 Web
按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。 流式响应 MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。
I。 说明: 在直播间制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响直播效果。直播过程中,这些插入的视频可以正常播放和展示。 视频要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。