检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中,具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1
有表情、骨骼数据 可由真人动作驱动 能呈现自定义表情&动作 剧本、画布和设置 视频制作、视频直播功能,都需要进行视频创作,下面以视频直播为例,进行说明。 视频素材:如图中1区域所示,包括模板、角色、背景、贴图、视频、商品、文本等素材。支持使用预置的,也支持自定义生成。 画面布局:简称“
素材,支持对贴图进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 视频 视频界面详情,如图4所示。 上传后的视频不支持修改。如需修改视频内容,需本地修改完成后,再上传至控制台使用。 插入的视频不支持单独调节宽或高,仅支持宽高等
管理资产 支持在MetaStudio控制台管理资产,包括查询、重命名、激活/取消激活、查看详情、编辑、删除、恢复等操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作 > 资源”,如图1所示。 图1 资产 支持管理资产,详细操作如表1所示。 图2 资产详情
直播控制HTTP Command命令说明 分身数字人直播过程中,支持通过HTTP API的方式人工接管直播。人工接管以后,支持通过下述方式驱动数字人说话: 文本驱动方式:对应Command命令为“INSERT_PLAY_SCRIPT”,即插入表演脚本,用于互动回复。数字人不变时,
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
如需使用“出门问问声音制作”方式自定义声音,并用于视频制作,需要参考下述内容进行操作。出门问问自定义声音暂不支持用于智能交互和视频直播。其支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问小语种克隆套餐包:如果用户需要使用“出门问问声音制作”方式自定义生成声音,需要在云商店购买出门问问小语种克隆套餐包。
数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 父主题: 数字人
表3 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期
9ffa2c6c", } } 用户发送中断对话的消息 文本驱动数字人讲话过程中,支持使用INTERRUPT_CHAT命令,中断数字人与用户的对话。对话被打断后,数字人将停止说话,并发送下一次对话的START_CHAT消息给用户。 详细交互流程如下所示: 用户发送中断对话的消息。
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
予仅能使用MetaStudio,但是不允许删除MetaStudio的权限策略,控制他们对MetaStudio资源的使用范围。 如果账号已经能满足您的要求,不需要创建独立的IAM用户进行权限管理,您可以跳过本章节,不影响您使用MetaStudio服务的其他功能。 IAM是华为云提供
授权浏览器麦克风的访问权限 支持对Chrome浏览器和Mac系统的浏览器,授权麦克风的访问权限。 谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。
如何实时切换智能交互的语言和声音? 智能交互对话项目支持同时添加中文和英文语言,以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。
角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。 贴图:各类贴图列表,支持本地导入。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,支持本地导入,支持MOV、MP4、M4V、MKV、FLV、
上传资产 支持从本地上传资产,包括:模型、PPT、动画、素材、视频、场景、图片、音乐。资产上传的操作均相同,下面以上传图片为例进行演示。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上角
如何将WEBM视频转成MOV格式? 问题描述 视频制作时,如果使用透明背景合成视频,导出时仅支持生成WEBM格式视频。而常用的视频工具剪映、Premiere Pro等,不支持WEBM格式,需要先参考本节转为MOV格式。 解决方法 单击webm2mov,将视频格式转换小工具webm2mov_20240814
动接收”和“是否自动激活”,则对应资产转移任务的状态为“已接收”,否则为“待接收”。 支持资产任务执行下述操作: 查看:单击任务右侧的“查看”,查看转移任务详情。 取消转移:未接收的资产,支持单击转移任务右侧的“取消转移”,收回资产。 图3 转移任务管理 父主题: 资产管理
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“