检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
MetaStudio有哪些计费项? MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。 分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。
支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看
收音 收音说明 MetaStudio会使用视频中的语音,对应您口型的变化,来训练口型驱动效果,训练结果还会经过专家的技术审核。 所以在收音这方面,建议如下: 保证视频音画同步。 确保环境安静无噪声,模特人声清晰,无其他人声干扰,尽量减少视频底噪。 建议使用小蜜蜂或其他专业麦克风搭
购买简单,一次下单即可完成形象、声音和视频制作资源的购买。针对额外需求,支持客户选择不同档位套餐包进行充值。 极简体验 简化拍摄制作,使用一段2分钟的视频和1分钟的音频即可复刻自己的真人形象和声音,全程手机录制无需专业相机和专业绿幕环境。 高性价比 不到千元即可完成形象、声音定制,性价比超越业界。 应用场景
[VIDEO_2D,LIVE_2D] audio_source_type 否 String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 默认取值: VIDEO 表4 ActionBasicSampleInfo 参数 是否必选 参数类型 描述 action_name_zh
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
文件在资产中的分类。每种资产类型包含的文件分类不同。 MAIN:主文件 COVER:封面文件 PAGE:PPT内容页图片文件 SAMPLE:样例音频或样例动作文件 OTHER:其他文件 WHOLE_MODEL:全模型文件(3D数字人) USER_MODIFIED_MODEL:用户上传模型(3D数字人)
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: 数字人推理端用户。从RTC房间接收音频流,并推送视频流到RTC房间 END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature
应用示例 示例1:分身形象制作管理 示例2:声音制作任务管理 示例3:语音合成管理 示例4:视频制作 示例5:视频制作剧本管理 示例6:视频直播 示例7:视频直播对接实时音视频客户端SDK 示例8:资产管理 示例9:数字人名片制作 示例10:智能交互
3D数字人 3D数字人风格管理 3D数字人风格化照片建模 3D数字人语音驱动 3D数字人视频驱动
单击图标后,商品界面缩小展示。单击图标,可恢复为默认展示。 商品列表 默认展示全量商品。 插入素材 单击商品中的“插入素材”,下方展示当前商品已有的贴图、视频、文本、音频内容。 需要选中具体的素材,单击“+”图标,将选中素材添加至当前场景的直播画面中。 支持编辑商品,操作如下所示: 单击图标,选择一种素材类型,新增素材。
时不可再重训。 取值范围: 0-10 audio_source_type String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 supported_service Array of strings 该任务所生成的模型支持的业务类型,可多选 默认取值:
更新数字人名片制作 功能介绍 该接口用于更新数字人名片制作任务。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建数字人名片制作 功能介绍 该接口用于数字人名片制作任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-business-cards 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询数字人名片制作任务详情 功能介绍 该接口用于查询数字人名片制作任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述
修订记录 表1 修订记录 修改时间 修改说明 2024-11-13 本次变更如下: 新增发布2.1.0版本SDK,相比2.0.3版本,变更点如下所示: 支持文本问答。 startChat新增入参,参考表14,用来设置交互模式(语音问答/文本问答)。 新增接口activeInter