检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人
分配资源 SP用户如果需要将购买的资源分配给已关联的租户,需参考本节进行操作。 前提条件 已关联租户。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面
营销宣传风格文案 在这个快速变化的世界里,技术已经成为我们生活中不可或缺的重要元素。 它不断推动着我们的社会进步,改变着我们的生活方式。 家用机器人,是一款集合了众多顶尖科技的全新智能设备。 它不仅拥有出色的功能,还具备卓越的性能。 让您可以轻松体验畅快无比的运行速度和极致的使用感受
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio.avatarmodeling.number
创建技能 本节操作如下所示: 在MetaStudio控制台创建并导出技能文件 在科大讯飞创建同名技能后,导入技能文件 在MetaStudio控制台创建并导出技能文件 在MetaStudio控制台创建技能前,需要参考如下表格,在本地使用Excel文件,准备好技能问答对内容。 表1 智能交互问答对参考
基本概念 分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
预置音色ID列表 系统预置自研音色ID列表,如表1所示。 表1 预置音色ID列表 音色名称(中文) 资产ID(华东-上海一) 资产ID(华北-北京四) 音色名称(英文) 资产ID(亚太-新加坡) 云歌 075494c45b5aef529d55cd2a456e6076 0a4b548fd8d2d6998e1fc3fffb29f9bc
查看数字人定制任务 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人,请耐心等待。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明
创建声音制作任务(第三方模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言(
新闻播报风格文案 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID:支持查询全量音色ID。 在控制台查询音色ID(方式一
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio
互动管理 分身视频直播首页面的“互动管理”页签,支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面
直播带货风格文案 嗨,大家好!欢迎来到我们的直播间!我是今天的主播Lan。 非常高兴能够和各位在今晚的直播间相聚,希望今天在直播间里能和大家一起度过一段非常有意义的时光! 感谢每一位在直播间停留观看的朋友们,感谢大家进来咱们的直播间参与今天的互动、留言。 稍后我们的直播间不但会教学一些数字人视频的剪辑技巧
购买出门问问声音套餐 购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问语音合成套餐包
创建角色 支持在奇妙问创建角色,详情如下所示: 创建角色:在奇妙问创建问答角色。 查看角色信息:查看奇妙问创建的角色ID和角色密钥,即MetaStudio平台API调用所需的RoleId和AppSecret。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 创建角色 访问奇妙问
创建科大讯飞应用(星火交互认知大模型) 在科大讯飞创建星火交互认知大模型的应用。详细操作如下所示: 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型,不适用。建议参考创建科大讯飞应用(AIUI通用语义模型)单独为其创建应用。 创建应用 (可选)创建问答库 配置应用 查看应用信息
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议