检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
introduction_type 否 String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。
introduction_type 否 String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。
X-Request-Id String 请求ID。 表4 响应Body参数 参数 参数类型 描述 motion_capture_mode String 视频驱动模式。 HEAD:头部 HALF_BODY:半身 FULL_BODY:全身 AUTO:自动 默认取值: AUTO input_info InputInfo
视频驱动任务列表。 表6 VideoMotionCaptureInfo 参数 参数类型 描述 motion_capture_mode String 视频驱动模式。 HEAD:头部 HALF_BODY:半身 FULL_BODY:全身 AUTO:自动 默认取值: AUTO input_info InputInfo
测试用户判断。 表3 请求Body参数 参数 是否必选 参数类型 描述 motion_capture_mode 否 String 视频驱动模式。 HEAD:头部 HALF_BODY:半身 FULL_BODY:全身 AUTO:自动 默认取值: AUTO input_info 否 InputInfo
学术交流和教育合作也是非常重要的, 它们可以促进知识的共享和学术发展,同时也可以加强不同国家和地区的联系。 学习外语和翻译也是非常有用的, 它们可以帮助我们更好地理解和欣赏其他国家的文化和价值观,促进不同文化之间的交流。 艺术展览、文学节和演出等活动是艺术家和作品展示和交流的舞台,
成3D数字人表情和肢体驱动数据的一种技术。 其基本情况包括: 输入数据:语音音频数据。 算法原理:通过深度学习算法,提取语音音频中的特征,并转化为表情驱动的表情基系数。 输出结果:表情基系数。 应用领域:应用于3D数字人文本和语音驱动场景,包括:短视频制作、直播和交互等。在特定场
虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。 服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。
区域限制 数字内容生产线服务目前只支持“华北-北京四”和“亚太-新加坡”区域。 父主题: 使用限制
转移资产 当前租户支持转移声音和分身模型资产给其他租户。声音和分身模型资产的转移操作均相同,下面以分身模型资产为例进行操作演示。 前提条件 如果当前租户希望转移资产给其他租户,需要提交工单或联系大客户经理,并提供已获取的项目ID,申请加入白名单。 租户所在Region的项目ID获取方法,请参见获取项目ID。
支持接收资产管理员或其他租户转移给当前租户的声音和分身模型资产。声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产为例进行操作演示。 注意事项 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要管理员或其他租户重新推送资产给当前租户。
授权书 分身形象或声音定制的授权书,如中文授权书和英文授权书所示。 父主题: 附录
查看租户资源用量信息 功能介绍 查询租户一次性和包周期(包年/包月)资源用量信息。 按需套餐包用量本接口无法查询,需要调用CBC接口查询。按需套餐包用量查询和查询资源包信息。 各种资源的计费方式请参考计费说明。 调用方法 请参见如何调用API。 URI GET /v1/{proj
开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。 父主题: 产品咨询
开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。 父主题: FAQ
MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。 分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。 资产管理费用:即服务资产管理的费用。
MetaStudio各特性版本的功能发布和对应的文档动态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2022年12月 序号 功能名称 功能描述 阶段 相关文档 1 数字内容生产线服务上线(受限公测) MetaStudio依托图形引擎和空间引擎两大媒体引擎,提供3D模型制
如何调用MetaStudio接口? MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: FAQ
轻量规格 购买简单,一次下单即可完成形象、声音和视频制作资源的购买。针对额外需求,支持客户选择不同档位套餐包进行充值。 极简体验 简化拍摄制作,使用一段2分钟的视频和1分钟的音频即可复刻自己的真人形象和声音,全程手机录制无需专业相机和专业绿幕环境。 高性价比 不到千元即可完成形象、声音定制,性价比超越业界。
模特表现 模特表现 拍摄过程中模特的手部动作、面部表情及各方面的状态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为保证数字人的训练效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15-30秒静默