检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
购买出门问问声音套餐 购买出门问问声音套餐, 详见购买出门问问语音合成套餐的操作流程。 购买出门问问语音合成套餐的操作流程 如需使用系统预置的第三方声音,需要购买出门问问语音合成套餐包,详细的操作流程如下所示。第三方声音支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问
关联租户 SP用户可以将购买的资源分配给多个租户使用。分配资源前,需先参考本节,关联所有租户。 前提条件 关联租户已注册华为账号:单击进入注册页面。 关联租户已完成实名认证:单击进入实名认证。 关联租户提供项目ID给SP用户,获取项目ID的方法请参见获取项目ID。 关联租户提供的
视频制作 MetaStudio服务支持制作数字人视频。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。 图1 视频制作界面 在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。
互动管理 分身视频直播首页面的“互动管理”页签,支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
账户设置 默认情况下,同一华为云账号下的IAM子账户资源共享,如下所示: 各IAM子账户的已购资源共享:即每个IAM用户看到的可用资源总量是所有IAM用户已购资源可用数量的总和,所有IAM用户都可以使用。所以即使当前IAM用户没有消耗资源,如果其他IAM用户在消耗资源,也会看到资源数量在减少。
主入口(HwICSUiSdk) 本节介绍Web SDK的接口详情。 表1 接口 接口 描述 三方驱动场景(是否支持) 非三方驱动场景(是否支持) activeInteractionMode 获取当前生效的交互模式(语音问答/文本问答)。 × √ addEventListeners
分配资源 SP用户如果需要将购买的资源分配给已关联的租户,需参考本节进行操作。 前提条件 已关联租户。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。
视频制作 用户可以使用MetaStudio控制台首页的“分身视频制作”功能,制作数字人视频。 操作前准备 如果系统预置形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。 操作限制 MetaStudio控制台预置形象的有效使用期为3年,在2027年的年中前可放心使用
新闻播报风格文案 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变。
制作名片 用户可以为分身数字人制作形象名片,且支持试听和查看数字人语音表达效果。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身数字人名片制作”,弹出“请选择您要使用的名片模板”对话框,如图1所示。 服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
创建Flexus分身数字人定制任务 本节提供MetaStudio服务Flexus数字人及其声音的制作过程。 注意事项 Flexus形象制作限制,如Flexus形象制作限制所示。 操作前准备 用户创建Flexus分身数字人定制任务前,需要准备如下内容: 1~5分钟的真人实景拍摄视频
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。
拍摄形象采集视频 您好!欢迎使用华为云数字人服务,本指南将协助您完成分身数字人形象的采集工作。 请注意,分身数字人形象制作的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您使用以下标准进行拍摄。 以下是数字人拍摄标准概览,但是我们也建议您详细阅读每一块具体内容:
创建分身数字人定制任务 MetaStudio服务已预置多个数字人形象,可在视频制作界面或直播间界面查看。如果预置形象无法满足用户的需求,可以参考本节操作,自定义生成分身数字人。 注意事项 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授
m4a,主文件大小不超过100M 幻灯片资产:资产类型为PPT,主文件格式(忽略大小写)为ppt、pptx和pdf,主文件大小不超过100M 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets 表1 路径参数 参数 是否必选 参数类型 描述