检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建资产 功能介绍 该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG)。
无论是预约洗衣服务、订餐、调节家居温度还是其他家务,智慧管家都能轻松胜任。 98. 日程管理:智慧管家可以帮助您管理日程安排,无论是重要的会议、约会、生日还是其他重要事件,它都可以为您记录并提醒。 99. 您只需告诉它您的日程安排,它就会在适当的时候提醒您,以确保您不会错过任何重要的事情。
SP用户限制 表1 限制说明 限制项 说明 开放范围 SP用户仅对大客户开放申请和使用。 功能范围 SP用户仅支持购买大颗粒度资源包,并分配资源给关联租户使用。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 资源使用限制 SP用户购买形象制作时,不会赠送视频制作时长。
服务支持的字体 MetaStudio制作视频添加的字幕,视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。 表1 服务支持的字体说明 字体名称 支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold
更新分身数字人模型训练任务 功能介绍 该接口用于更新分身数字人模型训练任务。用于在自动审核或者人工审核不通过情况下,更新训练视频、身份证照片等。 该接口只能在AUTO_VERIFY_FAILED或者MANUAL_VERIFY_FAILED状态下调用 调用方法 请参见如何调用API。
照片数字人限制 照片数字人视频制作限制说明,如表1所示。 表1 照片数字人视频制作限制 照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。
查询数字人智能交互任务 功能介绍 该接口用于查询数字人智能交互任务。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs/{job_id}/state
查询预置音色ID 支持在MetaStudio控制台界面通过F12查询自研音色ID,或者通过查询资产列表接口查询自研音色ID。 在控制台查询自研音色ID 支持在MetaStudio控制台界面通过F12查询自研音色ID,操作如下所示: 登录MetaStudio控制台。 单击“分身视频
项目ID,获取方法请参考获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 business 否 String 业务类型。可填多个用","分隔 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理 MODELING_2D:形象制作
查询资产详情 功能介绍 该接口用于查询资产库中指定媒体资产的详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-assets/{asset_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
创建分身数字人模型训练任务 功能介绍 该接口用于创建分身数字人模型训练任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型
形象拍摄指导文档下载 如需查看拍摄真人视频的PDF文件,请单击形象拍摄指导下载文件。 父主题: 形象制作
资产管理说明 资产管理说明,如下所示: 资产存储计费说明 资产创建失败说明 资产冻结说明 资产存储计费说明 资产存储计费说明,如表1所示。 表1 资产存储计费说明 资产存储 计费说明 免费存储空间 MetaStudio服务免费赠送每个租户5GB资产存储空间,用于上传各类音视频、图
数字内容生产线MetaStudio是什么? 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 父主题: 产品咨询
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如
申请成为SP用户 MetaStudio支持SP模式,此模式对大客户开放,相当于服务的分销商。SP用户支持购买大颗粒度资源包,并分配资源给关联租户使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。
修订记录 表1 修订记录 修改时间 修改说明 2024-12-05 第十三次正式发布 本次变更如下: 新增接口组:分身数字人字幕文件生成管理。 新增接口组:第三方直播平台管理。 2024-11-30 第十二次正式发布 本次变更如下: 语音合成管理接口组,新增接口:创建TTS异步任务、获取TTS异步任务。
形象制作 部分浏览器提交H265训练视频失败如何处理?
租户执行分身数字人模型训练任务命令 功能介绍 该接口用于租户执行分身数字人模型训练任务命令,如提交训练审核等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}/command