检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产 完成上述操作后,声音和分身模型资产已经在当前账号下生效,用户可以使用已激活的资产进行视频制作或视频直播。
在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码
导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图4所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。
相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明如表1或表2所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“华为云CBS”。
生成预览 单击“生成预览”,选择“当前场景”或“所有场景”,以预览其对应的音频和字幕播放效果。 须知:预览视频为静态页面,需合成视频后,才能查看视频动态播放效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标
所需费用按照不同的计费方式产生,具体详情如表1所示。 用户可以在MetaStudio控制台服务概览页面,单击“购买资源”,购买所需资源。 如需体验新用户优惠活动,可以查看MetaStudio数字人专场。 表1 计费项说明 类别 计费项 计费说明 计费方式 分身数字人 Flexus分身数字人 按Flexus数字人生成个数和声音克隆个数计费。
相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“第三方驱动”。
VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer
在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,,如图1所示。 参数配置说明如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户的手机号。 APPSECRET
已在AIUI开放平台新增配置完成应用。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 配置说明如下所示:
metastudio.modeling.enterpriselivepackage 包含: 形象制作5个 声音制作5个 视频制作5路 说明: 查询接口中通过business_type来区分3种类型。 智能交互基础版 路 包年包月 hws.resource.type.metastudio
理的期限内删除您的个人信息或进行匿名化处理。 如何联系我们 我们设立了个人信息保护专职部门,您可以在注册华为云账号后,通过访问个人行使权利的申请受理页面,我们会尽快回复。 公司注册地址:贵州省贵安新区黔中大道交兴功路华为云数据中心,华为云计算技术有限公司。邮编:550029。 如
Integer 每页显示的条目数量。 取值范围: 1-100 默认取值: 10 offset 否 Integer 偏移量,表示从此偏移量开始查询。 取值范围: 0-2147483647 默认取值: 0 start_time 否 String 起始时间。格式遵循:RFC 3339 如
MetaStudio FullAccess策略内容 MetaStudio ReadOnlyAccess MetaStudio只读权限,拥有该权限的用户仅能查看MetaStudio数据。 系统策略 MetaStudio ReadOnlyAccess策略内容 相关链接 IAM产品介绍 创建用户组、用
activeInteractionMode 获取当前生效的交互模式(语音问答/文本问答)。 × √ addEventListeners 回调注册。 √ √ checkBrowserSupport 检查浏览器是否支持。 √ √ create 创建交互任务。 √ √ destroy 销毁交互任务。
支持转移声音和模型资产给其他租户使用。 此功能暂未对外开放,如需使用,需提交工单申请。 支持删除资产。 数字人名片 支持为分身数字人制作形象名片。通过名片可以查看数字人形象和说话效果。 照片数字人 支持通过静态的人脸照片生成视频。 SP用户 MetaStudio支持SP模式,此模式对大客户开放,用于
自动驾驶具备安全合规、数据管理高效、算法训练高效、生态开放等优势。 华为云|自动驾驶 图3 技能编辑页面 表3 问答对 参数 说明 主题 输入主题,便于问题查找,不包含问题内容。 所有问法 输入所有提问方式。问法包括同一个问题的不同提问方式。 支持最多添加500个相似问题,每个问题不能超过64个字符。
相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。
高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。 自定义声音应用方式,如下所示:
第三方语言模型生成的消息,以SSE流式形式返回给MetaStudio智能交互服务。即生成内容通过增量方式逐个发送,每个data字段均包含一部分生成的内容,直至所有data返回完成后,响应结束。 流式响应结束的标识为:结尾必须使用“data:[DONE]”作为结束符。 状态码: 400