检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。 表2 防火墙域名白名单 序号 域名 1 *.dbankcdn
Flexus分身数字人形象采集指南 本节将协助您完成Flexus分身数字人形象的采集工作。请注意,您的数字人形象会与录制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。
数字内容生产线计费项包含分身数字人、3D数字人和资产管理费用。详细的价格信息,请参见产品价格详情。 所需费用按照不同的计费方式产生,具体详情如表1所示。 表1 计费项说明 类别 计费项 计费说明 计费方式 分身数字人 Flexus分身数字人 按Flexus数字人生成个数和声音克隆个数计费。
激活资源 目前支持购买的资源类型,如表1所示。 需激活“一次性计费”产品后使用,必须在一年内激活,否则无法再激活使用。从激活日期开始计算,产品有效期为一年。 按需套餐包和包年/包月产品,可直接使用,无需激活。必须在有效期内使用完成,超出有效期后,自动失效。 表1 资源类型 服务类型 产品分类
登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择声音制作方式“基础版声音制作”,音频格式为WAV或MP3文件。需整段录制,每句之间有2
在科大讯飞创建同名技能后,导入技能文件 在MetaStudio控制台创建并导出技能文件 在MetaStudio控制台创建技能前,需要参考如下表格,在本地使用Excel文件,准备好技能问答对内容。 表1 智能交互问答对参考 序号 主题 所有问法 文本答案(2048) 关键词 1 自动驾驶的优势 自动驾驶的优势
MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 配置说明如下所示: 科大讯飞平台应用的“自然语言模型”配置为“AIUI通用语义模型”时,
24年9月27日起,对中国大陆分身数字人形象制作、声音制作进阶版、视频制作的按需计费及按需预付费套餐包,进行统一调价。调整后的价格如表1所示。 表1 中国大陆价格调整详情 产品分类 计费方式 调价前 调价后 分身数字人形象制作 一次性预付费时长包 8000元/个 5999元/个 声音制作进阶版
使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面,如图2所示。 图2 租户列表 单击租户名称右侧的“分配”,弹出“分配资源”对话框,如图3所示。
参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 如果已配置对话机器人服务CBS,请从下拉框中选择“华为云CBS”。 应用名称 用户根据实际情况自定义即可。 问答机器人ID CBS控制台的“智能问题机器人”页面中,问题机器人列表中“问题机器人名称
有关部门制定的办法和相关标准进行安全评估,并符合其要求。同时您还取得最终用户的单独同意。 支持用户方便的行使数据主体权利,例如查阅、复制、更正、删除个人信息等权利。 二、声明SDK处理的个人信息 在您接入、使用数字人智能交互Web SDK服务前,我们要求您在隐私政策中向用户告知我
我们先来关注一下生活类新闻, 近年来,随着健康意识的提升,全国范围内的健身热潮愈发火爆。 从早晨的广场舞到晚上的健身房,人们纷纷加入到各种形式的健身运动中。 专家表示,通过持续锻炼可以增强体质、提高免疫力,是保持良好身心健康的重要途径。 近期,我国各大城市的绿化计划取得了显著进展。 通过大规模的植树造林
2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动 能呈现自定义表情&动作 剧本、画布和设置 视
字符长度0-1024 默认取值: 不涉及。 表7 TriggerProcess 参数 是否必选 参数类型 描述 time_window 否 Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制:
像万兴播爆,在营销视频方面,利用数字人,去解决真人精力产能有限、授权范围有限的问题,是现有真人信息沟通传播的补充与增强。 适用于不太注重人物表现力,借助口述传达信息内容的场景,比如产品介绍、功能教学、新闻报道、种草安利、网络直播、知识讲解、引导答疑等。 对于视频制作,有时间、人力、
字符长度0-1024 默认取值: 不涉及。 表20 TriggerProcess 参数 是否必选 参数类型 描述 time_window 否 Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制:
字符长度0-1024 默认取值: 不涉及。 表21 TriggerProcess 参数 参数类型 描述 time_window Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制: 不涉及
驱动数据的一种技术。 其基本情况包括: 输入数据:单人表演视频。 算法原理:通过深度学习算法识别人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据。 输出结果:表情基系数、数字人骨骼驱动数据。 应用领域:应用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。
字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer 参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值:
字符长度1-256位。 默认取值: 不涉及。 speed 否 Integer 参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围: 50-200 默认取值: