检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
互动管理 分身视频直播首页面的“互动管理”页签,支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 前提条件 已配置完成第三方应用,示例如创建智能交互数字人(科大讯飞)所示。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。
转移资产 当前租户支持转移声音和分身模型资产给其他租户。声音和分身模型资产的转移操作均相同,下面以分身模型资产为例进行操作演示。 前提条件 如果当前租户希望转移资产给其他租户,需要提交工单或联系大客户经理,并提供已获取的项目ID,申请加入白名单。 租户所在Region的项目ID获取方法,请参见获取项目ID。
创建智能交互数字人(SDK场景) 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。
修订记录 表1 修订记录 修改时间 修改说明 2024-12-10 本次变更如下: 新增发布2.2.0版本SDK,相比2.1.0版本,变更点如下所示: 新增接口sendDrivenText,支持发送智能交互数字人主动播报文本信息。 解决IDE加载TS声明文件报错问题。 2024-11-13
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。
如何获取项目ID? 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中“我的凭证”。 图1 管理控制台 在“API凭证”页面的项目列表中查看项目ID。 图2 获取项目ID 父主题: API和SDK使用
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
拍摄真人视频 概览 如需使用华为云MetaStudio服务定制分身数字人形象,需要参考本章节,完成分身数字人形象的采集工作。 请注意,分身数字人形象的制作效果与拍摄录制的内容效果有较大关联,为了后续能够体验到更好的数字人应用效果,我们建议您详细阅读每一节内容,并严格按照每节内容描述的标准进行拍摄。
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
创建Flexus分身数字人定制任务 本节提供MetaStudio服务Flexus数字人及其声音的制作过程。 注意事项 Flexus形象制作限制,如Flexus形象制作限制所示。 操作前准备 用户创建Flexus分身数字人定制任务前,需要准备如下内容: 1~5分钟的真人实景拍摄视频
查看任务 如果用户需要查看照片数字人视频生成任务,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“照片数字人”页签,如图1所示。 在“照片数字人”页面,可以查看全部生成的视频,包括生成中、生成成功和生成失败的任务。 在下方的
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
查看任务 如果用户需要查看分身数字人名片生成任务,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以查看全部任务,包括生成中、生成成功和生成失败的任务。 在下方的名片列表中
创建声音制作任务(第三方模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型自定义生成声音。 支持第三方模型“出门问问”:支持19种输入语言(中文、英文、粤语、德语、法语、土耳其语、菲律宾语、
申请成为SP用户 MetaStudio支持SP模式,此模式对大客户开放,相当于服务的分销商。SP用户支持购买大颗粒度资源包,并分配资源给关联租户使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
查询预置音色ID 支持在MetaStudio控制台界面通过F12查询自研音色ID,或者通过查询资产列表接口查询自研音色ID。 在控制台查询自研音色ID 支持在MetaStudio控制台界面通过F12查询自研音色ID,操作如下所示: 登录MetaStudio控制台。 单击“分身视频