检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概览 如需使用华为云MetaStudio服务定制分身数字人形象,需要参考拍摄真人视频,完成分身数字人形象的采集工作。 请注意,分身数字人形象的制作效果与拍摄录制的内容效果有较大关联,为了后续能够体验到更好的数字人应用效果,我们建议您详细阅读每一节内容,并严格按照各章节内容为标准进行拍摄。
收音 收音说明 MetaStudio会使用视频中的语音,对应您口型的变化,来训练口型驱动效果,训练结果还会经过专家的技术审核。 所以在收音这方面,建议如下: 保证视频音画同步。 确保环境安静无噪声,模特人声清晰,无其他人声干扰,尽量减少视频底噪。 建议使用小蜜蜂或其他专业麦克风搭
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
前提条件 需要申请开通智能交互权限后,才可以使用分身数字人智能交互功能。 智能交互对硬件设备的最低配置要求,如智能交互使用限制所示。 与数字人智能交互的界面,对浏览器的要求,如智能交互使用限制所示。 父主题: 智能交互
富的文化底蕴。 科技方面: 华为发布了鸿蒙操作系统,适用于各种设备,如手机、电视、手表和物联网设备。 这个系统有分布式架构,能让设备间无缝连接和协同工作。 AI在医疗领域的应用发展迅速。 比如,AI图像识别技术可以帮助医生提高疾病诊断的准确性和效率,也可以帮助医疗机构改善资源利用和服务质量。
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
如何调用MetaStudio接口? MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: FAQ
lastupdate_time Long 任务状态更新时间。 取值范围: 1-2147483647 voice_authorization_url String 用户授权书连接。 create_type String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据
表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String
文案样例(高品质) 直播带货风格文案 营销宣传风格文案 新闻播报风格文案 父主题: 声音制作
MetaStudio支持哪些区域? MetaStudio服务已商用,商用环境为“华北-北京四”。“华东-上海一”、“亚太-新加坡”目前仍为测试环境,如需使用,请提交工单处理。 父主题: FAQ
支持通过角色、性别、姿势、行业、区域、分辨率和动作的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换更新至视频草稿的所有场景中。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 在视频画面预览区域,如果存在多种视频素材,支持对数
CONFIRM_ANSWER:用户答复 CONFIRM_PENDING:用户挂起任务 CONFIRM_ACTIVE:用户激活任务 GET_MULTIPART_UPLOADED:获取训练视频已上传分片信息 CONFIRM_REPAIR:用户发起优化模型请求 CONFIRM_MUL
表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String
灯光布置 布置灯光 合适的灯光环境将大幅提升模特拍摄效果,所以我们提出如下建议: 使用3~4台专业的摄影灯来打光,包括:主光、辅助光、产品光(用于拍摄桌面产品)、背景光和(可选)轮廓光,具体布光方式如图1所示。 录制过程中,需要保证光线不发生显著变化。 确保背景绿幕均匀且明亮,避免有阴影或明暗不均。
模特形象 分身数字人不支持替换衣服,所以录制时的着装会决定生成的数字人着装。 在拍摄前,建议参照如下内容对模特形象进行检查。 模特着装要求 避免穿着任何会与背景融为一体的服装颜色。如绿幕背景下,不能穿绿色或任何含有绿色图案的服饰。 避免半透明、透光或反光材质的服饰。 避免穿带人脸图案或过多褶皱的服饰。
视频提交 提交视频的详细说明,如表1所示。 表1 提交视频说明 视频要求 说明 交付内容 拍摄完成后请提供一个视频素材用于数字人训练。 推荐视频格式为MP4。 视频大小通常小于5G。 提交训练的视频需要保留录制时的原声,且音画必须同步。 若对素材进行后处理,导出时请确保帧率与原视频一致。
文案样例(进阶版) 直播带货风格文案 营销宣传风格文案 新闻播报风格文案 直播带货风格英文文案 营销宣传风格英文文案 新闻播报风格英文文案 父主题: 声音制作
文案样例(基础版) 直播带货风格文案 营销宣传风格文案 新闻播报风格文案 直播带货风格英文文案 营销宣传风格英文文案 新闻播报风格英文文案 父主题: 声音制作
应市场需求,高效且及时地输出内容。 未来,Flexus数字人将在更多领域发挥重要作用,推动各行业的数字化转型,提升服务效率,降低成本,增强用户体验。 父主题: Flexus分身数字人