检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动
数字人支持添加动作吗? 需要数字人模型训练时使用的形象采集视频包含动作编排,才可以添加动作,详见动作编排定制采集指南。 目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。 添加动作时需要注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。
需注意: 首次购买或创建资产时,免费赠送5G存储空间。 下述场景,使用资产空间不会计费: 用户上传的分身数字人模型、3D数字人模型和声音。 平台生成的分身数字人模型、3D数字人模型和声音。 平台合成的视频资产6个月内,默认不计费。6个月以后,开始计费。 资产管理的含义:提供数字资产存储、简单分类、搜索等基础管理能力。
用于上传各类音视频、图片等素材。如果租户需要更多的存储空间,请购买单独的资产管理包月产品。 定制形象模型存储 基于MetaStudio服务定制生成的形象模型,其所包含的音色模型所占存储空间,暂不计入租户资产存储计费中。 定制视频资产存储 基于MetaStudio服务定制生成的视
选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。 第三方语言模型地址 MetaS
配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语义模型,则从下拉框中选择“科大讯飞AIUI通用语义模型”。 如果科大讯飞AIUI开放平台应用应用使用星火大模型,则从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与AIUI开放平台应用的“应用名称”保持一致。 APPID
String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution 否 String 参数解释: 分身数字人模型分辨率。 约束限制: 不涉及 取值范围:
model_version String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution String 参数解释: 分身数字人模型分辨率。 约束限制: 不涉及 取值范围:
实现数字人形象的验收操作。 图2 数字人定制任务 服务管理员会根据用户反馈的问题,重新优化数字人形象。 数字人定制任务,会重新进行模型训练。等待模型训练完成后,用户可以二次审验,继续4的操作,直至生成符合要求的分身数字人形象。 此时,在“我的创作 > 分身形象”页面,可以看到新增
model_version String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution String 参数解释: 分身数字人模型分辨率。 约束限制: 不涉及 取值范围:
boolean 是否直接初始化唤醒模型。 初始化唤醒模型需要2~3s的加载时间,这段时间无法进行其他操作,所以需要根据实际情况选择模型初始化的时间点,详细说明如下所示: 如果为true,会在接口执行时,初始化模型。 如果为false,会在数字人创建过程中,初始化模型。 【返回参数】 无。 【代码示例】
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
分身形象制作管理 创建分身数字人模型训练任务 查询分身数字人模型训练任务列表 查询分身数字人模型训练任务详情 删除分身数字人模型训练任务 更新分身数字人模型训练任务 租户执行分身数字人模型训练任务命令
制作好数字人后,可以不购买路数进行直播吗? 数字人模型只能通过MetaStudio服务驱动,不与其他第三方服务兼容。数字人形象制作与视频直播是两个独立的功能,需各自计费。可通过包周期或按需计费方式购买路数。 视频直播间的场景布置好之后,可以通过捕捉网页画面或RTMP推流的方式向第
第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE:
定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 父主题: 使用限制
定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 父主题: 使用限制
创建角色 支持在奇妙问平台创建角色,并配置已上传的外部知识库和问答库给大模型学习使用,让角色的问答信息更丰富。 创建智能交互数字人中的“第三方应用”选择“奇妙问”时,才需要执行本节操作。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。 客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。
标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
创建智能交互数字人(科大讯飞) 创建技能 在科大讯飞平台创建应用(AIUI通用语义模型) 在科大讯飞平台创建应用(星火交互认知大模型) (可选)提升问答交互次数 创建智能交互数字人 父主题: 智能交互