检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
资产归属分配 开启AM子账户隔离能力后,华为云账号可以在资产归属分配页面,修改所有资产的归属。 注意事项 开启AM子账户隔离能力后,各IAM子账户历史上传或制作的资产归属均已自动变更为华为云账号。 视频制作剧本、直播间、智能交互对话项目,暂不支持修改资产归属。 企业联邦虚拟用户,不支持修改资产归属。
功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。
声音制作限制 声音制作限制说明,如表1所示。 表1 声音制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音
形象制作限制 形象制作限制说明,如表1所示。 表1 形象制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。
营销宣传风格文案 在这个快速变化的世界里,技术已经成为我们生活中不可或缺的重要元素。 它不断推动着我们的社会进步,改变着我们的生活方式。 家用机器人,是一款集合了众多顶尖科技的全新智能设备。 它不仅拥有出色的功能,还具备卓越的性能。 让您可以轻松体验畅快无比的运行速度和极致的使用感受。
基本概念 分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。
查看数字人定制任务 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人,请耐心等待。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。
创建声音制作任务(第三方模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言
分身形象或声音制作的不好,可以使用原有资源重新制作吗? 分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
最新动态 本文介绍了数字内容生产线 MetaStudio各特性版本的功能发布和对应的文档动态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2022年12月 序号 功能名称 功能描述 阶段 相关文档 1 数字内容生产线服务上线(受限公测) MetaStudio依托图形引
新闻播报风格文案 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变。
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
直播带货风格文案 嗨,大家好!欢迎来到我们的直播间!我是今天的主播Lan。 非常高兴能够和各位在今晚的直播间相聚,希望今天在直播间里能和大家一起度过一段非常有意义的时光! 感谢每一位在直播间停留观看的朋友们,感谢大家进来咱们的直播间参与今天的互动、留言。 稍后我们的直播间不但会教
事件通知(EventMap) 本节介绍Web SDK的EventMap事件。 表1 通知列表 接口 描述 三方驱动场景(是否支持) 非三方驱动场景(是否支持) error 错误事件。 √ √ enterActive 数字人激活事件。 × √ enterSleep 数字人自动休眠事件。
购买出门问问声音套餐 购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。