检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作前提 注册操作 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrom
ReviewConfig object 内容审核配置。 callback_config 否 CallBackConfig object 回调设置。 表4 VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
回到“应用配置”页面,开启“兜底设置”及其下的“讯飞闲聊”,如图8所示。 讯飞闲聊能够完成基本的问答,或者委婉表达自己不知道答案。 图8 兜底设置 单击“应用配置”界面右上方的“保存修改”。 界面提示“保存成功”,说明应用配置页面的修改已生效。 配置热词。 展开“语音识别”下方的“高级设置”,如图9所示。
说明: 通过该地址上传时,需设置content-type为application/octet-stream audio_upload_url String 音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设置content-type为application/zip。
说明: 通过该地址上传时,需设置content-type为application/octet-stream audio_upload_url String 音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设置content-type为application/zip。
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
示例:分身数字人形象制作。 请选择资源实例 从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作 - 2025-11-01。 请选择资源数量 设置资源数量,不能超过所选资源实例已激活的数量。 示例:2。 请选择日期 资源激活后,从激活日期开始计算,有效期是一年。这里选择的日期,为有效期内的时间。
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、
操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 配置说明如下所示:
String 参数解释: 回复类型。 约束限制: 不涉及 取值范围: SYSTEM_REPLY:系统自动回复预先设置的话术。 CALLBACK:回调给其他服务,携带设置的话术。 SHOW_LAYER:仅显示叠加图层,不影响话术。 INTELLIGENT_REPLY:使用配置的大模型生成回复话术。
String 参数解释: 回复类型。 约束限制: 不涉及 取值范围: SYSTEM_REPLY:系统自动回复预先设置的话术。 CALLBACK:回调给其他服务,携带设置的话术。 SHOW_LAYER:仅显示叠加图层,不影响话术。 INTELLIGENT_REPLY:使用配置的大模型生成回复话术。
String 参数解释: 操作。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: ADD:增加 DELETE:删除 默认取值: 不涉及 key String 参数解释: 系统属性条目。 约束限制: 系统属性仅为系统设置,普通用户无法修改。 取值范围: 公共资产属性: BA
填写audio_meta system_properties 否 Array of SystemProperty objects 参数解释: 设置系统属性。内部参数,普通用户无需设置。 约束限制: 不涉及 取值范围: 个数最大为50个。 默认取值: 不涉及 shared_config 否 AssetSharedConfig
String 参数解释: 回复类型。 约束限制: 不涉及 取值范围: SYSTEM_REPLY:系统自动回复预先设置的话术。 CALLBACK:回调给其他服务,携带设置的话术。 SHOW_LAYER:仅显示叠加图层,不影响话术。 INTELLIGENT_REPLY:使用配置的大模型生成回复话术。
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
音频上传的地址。 说明: 通过该obs地址上传时需要设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。 说明: 通过该obs地址上传时需要设置content-type为text/plain 表4
用户可以单击“查看制作任务列表”,进入“任务中心 > 分身数字人”页面。 查看生成的Flexus分身数字人训练任务,其“服务类型”为“Flexus版”,任务名称为设置的“数字人名称”。这里的任务分身数字人训练耗时约3小时,请耐心等待。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数