检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
LV、3GP、WMV、AVI和WEBM。 说明: 在视频制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 插入的视频素材,要求如下所示:
操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明,如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。
按Flexus数字人生成个数和声音克隆个数计费。 须知: 每提交一个Flexus分身数字人定制任务,会同时生成一个Flexus形象和一个Flexus声音,对应消耗一个形象资源和一个声音资源。 按需预付费套餐包 一次性计费 Flexus分身数字人视频制作 按Flexus数字人视频制作时长计费。 视频制作计费说明,如下所示:
可以看到资源名称、可回收量、分配时间和到期时间。 图6 回收资源 根据实际情况,设置本次需要回收的数量(示例:1),单击“确定”。界面右上角提示“回收成功”,租户未使用的这些资源将被收回。 在“租户详情”页面的“资源列表”中可以看到,“分身数字人形象制作”的总量和可用量均从2降至1了。 图7
操作前提 注册操作 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 IAM权限管理 如果华为云账号
“产品分类”中高亮展示的是SP用户可购买的资源包类型,置灰展示的是未对SP用户开放的资源包类型。 图2 购买页面 SP用户根据实际情况,选择需要的服务类型、产品分类、计费模式和购买数量,单击“加入清单”,依次添加至右侧的“购买清单”中。 待购买清单全部添加完成后,单击“确认订单”,进入“规格详情”页面,如图3所示。
这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
支持持物直播、实景直播、弹幕智能互动、真人随时接管,让数字人直播更真实、更沉浸。 支持数字人直播矩阵式管理,高级策略配置管理直播更灵活。 实时智能交互,提升客户满意度和品牌形象 开放的Web SDK及API可快速集成到第三方业务系统,实现AI数字员工问答、服务、陪练等场景任务。 1.5秒超低时延交互 实时驱动极低延时,保障用户真实体验。
的SDK代码,如图1 获取SDK代码示例所示。 图1 获取SDK代码示例 SDK列表 目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 SDK已知安全漏洞及修复版
妙问)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。操作请参考创建智能交互数字人(二次开发场景)。 父主题: 智能交互
近日,旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。 多方纷纷站出来为丫丫发声,盼望它早日归来。 从网友的评论中和声援中,感受到了华人的温度, 前路依然充满荆棘,但我们绝不放弃,永不退缩。 “熊猫外交”也增强了国家文化的生命力、创新力、凝聚力和传播力。 八月二十四日中午十二时,日本福岛第一核电站启动核污染水排海。
操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 配置说明如下所示:
1小时以上,建议1小时。 每种声音制作方式后面都会展示剩余次数,需要保证剩余次数充足。录制过程中,每句之间有2~3秒的停顿。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 请制作声音 制作声音的方式为“语
所示。 输入如下参数的值: 技能名称:技能名称。必须与科大讯飞创建的技能一一对应,如在科大讯飞创建同名技能后,导入技能文件所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:技能标识。必须与科大讯飞创建的技能标识,保持一致,如在科大讯飞创建同名技能后,导入技能文件
次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复
单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象
在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字
注意:MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图5和图6所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。
如果不包含,请参考下述操作,购买问答机器人。 单击界面右上方的“购买问答机器人”,进入“购买问答机器人”页面。 请根据实际情况,输入问答机器人名称,选择计费模式、规格、路数和机器人有效期。 单击“确定”,进入“订单确认”页面。 单击“去支付”。按照界面提示支付完成。 图2 控制台 在“智能问答机器人”页面,单击问答机器人所在行的“机器人管理”。
在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于各服务