检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用。所以即使当前IAM用户没有消耗资源,如果其他IAM用户在消耗资源,也会看到资源数量在减少。 各IAM用户资产共享:即每个IAM用户上传的资产、制作的形象和声音资产(包括制作任务)、合成的视频(包括剧本和任务)、直播间,智能交互项目等,全部可共享使用。 前提条件 MetaSt
MetaStudio依托图形引擎和空间引擎两大媒体引擎,提供3D模型制作(Creator)、资产管理(Store)、内容编辑(Editor)、物理仿真(Simulation)、云渲染(Rendering)5大平台能力,帮助您快速构建高质量模型,用于虚拟直播、虚拟视频内容制作等适用于教育课件、电商带货、社交文娱等场景。
在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能
(亚太-新加坡) 数字资产管理 创建资产 10次/秒 5次/秒 5次/秒 查询资产列表 20次/秒 10次/秒 10次/秒 更新资产 10次/秒 5次/秒 5次/秒 删除资产 10次/秒 5次/秒 5次/秒 查询资产详情 20次/秒 10次/秒 10次/秒 恢复被删除的资产 10次/秒 5次/秒
(亚太-新加坡) 数字资产管理 创建资产 10次/秒 5次/秒 5次/秒 查询资产列表 20次/秒 10次/秒 10次/秒 更新资产 10次/秒 5次/秒 5次/秒 删除资产 10次/秒 5次/秒 5次/秒 查询资产详情 20次/秒 10次/秒 10次/秒 恢复被删除的资产 10次/秒 5次/秒
Flexus支持通过API集成使用吗? 支持,详见接口创建分身数字人模型训练任务的is_flexus字段。 父主题: API和SDK使用
47000013 model file down fail 请检查人物模型资产文件是否存在,不存在请更换人物模型,如果存在请联系技术支持 MSS.47000014 background file down fail 请检背景图片资产文件是否存在,不存在请更换背景,如果存在请联系技术支持 MSS
图1 直播状态变化流程图 流程图说明,如下所示: PREPROCESSING:MetaStudio直播服务启动加载形象模型的状态。 PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCESSING:数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。
何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets 创建资产 GET /v1/{project_id}/digital-assets 查询资产列表 PUT /v1/{projec
主要功能如下所示,详见功能特性。 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。
字员工问答、服务、陪练等场景任务。 1.5秒超低时延交互 实时驱动极低延时,保障用户真实体验。 多模型数字人大脑 华为云智能问答机器人CBS 华为云盘古大模型 科大讯飞星火交互大模型及AIUI 能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 表8 VoiceConfig
第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE:
音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。
<insert-action>:动作标签,可在文本的指定位置插入动作。用法为:<insert-action id="动作资产ID" name="动作名称" tag="动作标识"/>。动作资产信息是通过资产库接口查询获取的。 <break>:停顿标签,可在文本的指定位置插入停顿。用法为:<break t
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 状态码:400
第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE:
description 否 String 一段描述信息,会呈现在资产库中。 sex 否 String 语音性别,是男性声音还是女性声音。 FEMALE: 女性 MALE: 男性 voice_name 否 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String
该参数已废弃,照片数字人视频制作使用“创建照片分身数字人视频制作任务”接口。 model_asset_id String 分身数字人模型资产ID,可以从资产库中查询。 voice_config VoiceConfig object 语音配置参数。 video_config VideoConfig
VIDEO: 素材视频图层 TEXT: 素材文字图层 默认取值: 不涉及 asset_id 否 String 参数解释: 图层所需资产的资产id,外部资产信息无需填写。 约束限制: 不涉及。 取值范围: 字符长度0-64位 默认取值: 不涉及 group_id 否 String 参数解释: