云服务器内容精选

  • 服务介绍 界面最上方提供MetaStudio服务介绍和下述操作入口: 前往MetaStudio工作台:仅租户有此操作入口。单击此入口,可以进入MetaStudio工作台,进行声音制作、形象制作、视频制作、 视频直播 制作等操作。 购买资源:SP用户和租户均有此入口。单击“购买资源”,进入购买资源页面。可以选择当前区域、服务类型、产品分类、计费模式等信息,购买对应的资源。各类产品的计费说明,详见计费说明。 关联租户:仅SP用户有此入口。单击“关联租户”,进入“关联租户”信息配置界面。输入租户所在区域的项目ID和租户名称,租户名称支持自定义。单击“创建”,租户新增完成。
  • 我的资源(租户) 租户在“我的资源”区域,可以看到资源剩余量详情,如表1所示。也可以单击左侧导航栏中的“我的资源”,查看所有资源的剩余量列表详情。 如果计费项支持按需计费,可按需开通或关闭按需计费,详细操作如下所示: 如需开通按需计费,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 按需计费开通后单击“关闭”,关闭按需计费。 表1 我的资源 资源分类 资源 说明 分身数字人 Flexus分身数字人 左下角展示用户已购买资源的剩余量。 仅Flexus视频制作支持开通或关闭按需计费。 分身数字人形象制作 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 声音制作 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频制作 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频制作支持开通或关闭按需计费。 分身数字人视频直播 左下角展示用户当前剩余可用的视频直播路数,即用户还可以并发开启的视频直播数量。 分身数字人视频直播支持开通或关闭按需计费。 分身数字人智能交互 左下角展示用户当前剩余可用的智能交互路数,即用户还可以并发开启的数字人交互对话数量。 分身数字人名片制作 左下角展示用户已购买资源的剩余量。 分身数字人名片制作支持开通或关闭按需计费。 照片数字人视频制作 左下角展示用户已购买资源的剩余量。 照片数字人视频制作支持开通或关闭按需计费。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 声音合成支持开通或关闭按需计费。 如需查看声音合成的使用量,单击左下角的“已使用量”,跳转至费用中心的“流水和明细账单”页面,搜索查看声音合成的详细账单。 3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 视觉驱动 左下角展示用户已购买资源的剩余量。 资产管理 资产管理 左下角展示资产存储空间的已使用量,单位:GB。 须知: 用户首次使用MetaStudio服务,会免费赠送5G的存储空间。 资源总量默认包含免费赠送的5G存储空间。 目前资产管理,在内侧 免费体验 中,所以存储空间可以为负数。内测体验到期后,会在Metastudio控制台进行公告提醒。 届时请及时对超出使用额度的资源进行清理或及时购买扩容存储空间,以免造成资源丢失。
  • 我的资源(SP用户) 租户在“我的资源”区域,可以看到资源剩余量和总量详情,如表2所示。 也可以单击左侧导航栏中“资源管理”,查看所有资源用量的详情列表。 按需计费开通后,不支持关闭,请谨慎评估后再开通。 表2 我的资源 资源分类 资源 说明 分身数字人 Flexus分身数字人 左下角展示用户已购买Flexus分身数字人的剩余量和总量。 单击图标,可以查看Flexus分身数字人和Fluxus视频制作剩余量的详情列表。 分身数字人形象制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 声音制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频直播 左下角展示用户当前剩余可用的视频直播路数和已购买的总路数,即用户还可以并发开启的视频直播数量及总购买数量。 如需开通按需计费,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 分身数字人智能交互 左下角展示用户当前剩余可用的智能交互路数和已购买的总路数,即用户还可以并发开启的数字人交互对话数量及购买的总数量。 单击图标,可以查看剩余量详情的列表数据。 分身数字人名片制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 照片数字人视频制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 如需开通按需计费,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。
  • 数字人相关问题 数字人相关问题集合,如表1所示。 表1 数字人问题 序号 问题 答案 1 数字人支持换脸吗? 不支持。 2 数字人支持换衣服吗? 不支持。 3 数字人支持添加动作吗? 需要使用包含动作编排的形象采集视频训练生成的数字人形象,才可以添加动作,详见动作编排定制采集指南。 目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。添加动作时需要注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。 4 数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持 TTS 和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。MetaStudio不提供ASR(语音转文本),用户如有ASR需求,可以查看 语音交互 服务或其他ASR服务。 图1 视频制作 父主题: FAQ
  • 功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。 功能详情,如表1所示。 表1 功能特性 功能名称 功能描述 形象制作 拍摄真人视频,建模生成数字人形象。 数字人形象可用于生成音视频内容,应用于视频制作、视频直播和智能交互。 须知: 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 数字人不支持换脸、换衣服。 如果形象训练视频包含动作编排,那么生成的数字人卡片会有标识,说明当前数字人支持添加动作。 Flexus分身数字人 分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 须知: Flexus版视频制作和标准版视频制作的资源相互独立,各自计费。 声音制作 录制真人声音,建模生成声音模型。 声音模型可为数字人配音,生成音视频内容,应用于视频制作、视频直播和智能交互,或生成数字人名片和照片数字人。 须知: 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。 RTMP直推方式,即华为云MetaStudio直接把画面传输给第三方直播平台,需从直播平台获取推流地址。如果直播平台无法提供推流地址,可通过窗口捕获方式开播。 智能交互 对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广泛,包括智能导购、文旅导览、智能问答、营业厅客服等。 注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。 支持转移声音和模型资产给其他租户使用。 此功能暂未对外开放,如需使用,需提交工单申请。 支持删除资产。 数字人名片 支持为分身数字人制作形象名片。通过名片可以查看数字人形象和说话效果。 照片数字人 支持通过静态的人脸照片生成视频。 SP用户 MetaStudio支持SP模式,此模式对大客户开放,用于分销场景。SP用户支持购买大颗粒度资源包,并分配资源给关联租户使用。
  • 服务限制 在使用数字内容生产线服务前,您需要了解本服务的使用限制信息,如表1所示。 表1 服务限制 限制项 说明 区域限制 数字内容生产线服务目前只支持“华北-北京四”和“亚太-新加坡”区域。 预置模特使用限制 MetaStudio控制台预置模特的有效使用期为3年,在2027年的年中前用户可以放心使用。 具体下线时间请关注MetaStudio服务,会提前3个月在现网开放下线公告。 父主题: 使用限制
  • 剧本、画布和设置 视频制作、视频直播功能,都需要进行视频创作,下面以视频直播为例,进行说明。 视频素材:如图中1区域所示,包括模板、角色、背景、贴图、视频、商品、文本等素材。支持使用预置的,也支持自定义生成。 画面布局:简称“画布”,如图中2区域所示。可以在画布中插入人物形象、背景、贴图、文本框、视频等内容,支持调整各项直播素材的大小和图层位置。所有的设置效果均在画布中直观可见。 开播设置:简称“设置”,如图中3区域所示,包括视频直播的各类设置。 剧本设计:简称“剧本”,视频制作和视频直播的全流程制作过程,统称为剧本设计,包含素材准备、画布设计、开播设置等操作,最终合成视频。 图1 直播间编辑界面
  • 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。 服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动 能呈现自定义表情&动作
  • 华为云MetaStudio数字人语音驱动算法 表5 语音驱动算法 算法项 描述 算法名称 华为云MetaStudio数字人语音驱动算法 备案编号 网信算备520111252474601240061号 算法基本原理 数字人语音驱动算法是指使用深度学习将语音转换成3D数字人表情和肢体驱动数据的一种技术。 其基本情况包括: 输入数据:语音音频数据。 算法原理:通过深度学习算法,提取语音音频中的特征,并转化为表情驱动的表情基系数。 输出结果:表情基系数。 应用领域:应用于3D数字人文本和语音驱动场景,包括:短视频制作、直播和交互等。在特定场景中,可替代人快速生成视频内容,提升内容生成的效率。 算法运行机制 训练阶段输入预先获取的高质量语音及其表情基系数,通过学习获得语音特征与表情基系数的关系。 用户使用时,输入音频流或音频文件。 音频经过安全审核后,进入下一步操作,否则不返回结果。 对音频特征提取后,获取音频特征,再通过算法将音频特征转换为表情基系数。 返回结果数据。 算法应用场景 数字人语音驱动算法可用于短视频制作、直播、交互等场景。在特定场景中,可替代人快速生成视频内容,以提升内容生成的效率。 算法目的意图 通过学习语音与表情基系数的关系,实现使用语音生成视频的能力。在使用数据人形象生成视频的场景,包括短视频制作、直播、智能交互等,可快速生成不同台词的视频内容。
  • 华为云MetaStudio数字人照片建模算法 表3 照片建模算法 算法项 描述 算法名称 华为云MetaStudio数字人照片建模算法 备案编号 网信算备520111252474601230033号 算法基本原理 数字人照片建模算法是指使用深度学习算法将已授权的人像照片信息转换为数字人3D模型的一种技术。 其基本情况包括: 输入数据:有授权的人像照片。 算法原理:使用深度学习算法,将人像照片转换为数字人3D模型。 输出结果:数字人3D模型。 应用领域:数字人照片建模算法可应用于影视制作、仿真形象生成、虚拟现实等领域,能加速数字人3D模型产业的生产效率。 算法运行机制 选择一张已授权的人像照片作为输入。 输入的人像照片经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将人像照片输入至算法模型中,通过特征提取、人脸重建、素材特征匹配等进行人头重建,生成3D人头模型。 生成的人头模型通过配上默认身体素材配件,形成完整的3D数字人模型,并返回结果。 算法应用场景 数字人照片建模算法可应用于影视制作、仿真形象生成、虚拟现实等领域,能加速数字人模型产业的生产效率。 算法目的意图 使用已授权的人像照片生成3D数字人模型,应用于如下场景: 用于影视动漫制作角色初始模型的快速生成。 用于虚拟现实Avatar形象快速生成。 其他需要数字人3D形象的领域,快速提升形象生成效率。
  • 华为云MetaStudio分身数字人声音制作算法 表2 声音制作算法 算法项 描述 算法名称 华为云MetaStudio分身数字人声音制作算法 备案编号 网信算备520111252474601240079号 算法基本原理 分身数字人声音制作算法是指使用深度学习算法生成数字人声音模型,再使用该模型通过输入文字生成数字人语音的一种技术。 其基本情况包括: 输入数据:真人语音音频 。 算法原理:通过深度学习算法,学习真人语音音频生成数字人声音模型,通过该模型,输入文本生成数字人语音。 输出结果:接近真人音色的数字人语音。 应用领域:分身数字人声音制作算法可以应用于数字人视频合成时的语音配音。在新闻播报、课件制作等场景模拟真人配音,提升数字内容生产效率。 算法运行机制 训练阶段: 用户上传一段真人语音音频及授权书作为输入。 音频经过人工安全审核和授权认证后,由训练人员标注用于训练的音频数据,使用深度学习算法训练生成数字人声音模型。 推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。 输入文本使用数字人声音模型推理生成数字人语音。 算法应用场景 分身数字人声音制作算法可以应用于数字人 语音合成 。在新闻播报、课件制作等场景模拟真人配音,提升数字内容生产效率。 算法目的意图 可以通过有授权的真人语音音频,在预训练模型基础上微调生成数字人声音模型,该模型可用于基于文本合成类似真人音色的数字人语音。
  • 华为云MetaStudio数字人视觉驱动算法 表4 视觉驱动算法 算法项 描述 算法名称 华为云MetaStudio数字人视觉驱动算法 备案编号 网信算备520111252474601240053号 算法基本原理 数字人视觉驱动算法是指使用神经网络,将视频中的人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据的一种技术。 其基本情况包括: 输入数据:单人表演视频。 算法原理:通过深度学习算法识别人脸表情和人体姿态,转换为表情基系数及数字人骨骼驱动数据。 输出结果:表情基系数、数字人骨骼驱动数据。 应用领域:应用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。 算法运行机制 输入为单人表演视频。 通过视频抽帧得到单张图片。经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。 对算法输出系数进行平滑处理及异常数据过滤,返回结果。 算法应用场景 数字人视觉驱动算法可用于影视制作、虚拟人姿态控制等场景,加速影视制作的动画生成效率,提升虚拟人控制体验。 算法目的意图 视频驱动数字人动作,实现影视制作动画快速生成。 虚拟现实Avatar形象姿态控制。 其他需要通过表演者驱动数字人动作表情的领域,以提升形象动画生产效率。
  • 华为云MetaStudio分身数字人驱动算法 表1 分身数字人驱动算法 算法项 描述 算法名称 华为云MetaStudio分身数字人驱动算法 备案编号 网信算备520111252474601240045号 算法基本原理 分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。 输出结果:数字人视频。 应用领域:分身数字人驱动算法可以应用于真人视频自动生成,包括新闻播报,课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。 算法运行机制 选择一段真人视频。 输入真人视频,经过平台专家安全审核通过,且用户授权使用后,由训练人员选取真人视频中符合要求的视频进行预处理。预处理完成后,进行深度学习训练,生成该真人形象的数字人驱动模型。 推理阶段输入一段音频。 音频输入至数字人驱动模型后,经过模型推理生成数字人形象播报视频。 数字人视频通过审核后返回给用户。 算法应用场景 分身数字人驱动算法可以应用于真人视频自动生成,包括新闻播报、课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。 算法目的意图 可以使用授权过的真人视频,在预训练模型基础上,生成真人数字人驱动模型。该模型可基于音频生成口型匹配的数字人视频,实现真人视频自动生成,包括新闻播报、课件制作等场景,以取代真人视频拍摄,提升视频内容生产效率。
  • API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。 如果调用API时,返回“APIGW.0308”错误信息,是触发了API流控限制。需要参考下述表格中的流控值,调整调用API的间隔时间,控制请求的发送速度;或者等待一段时间后,再发送API请求。 “APIGW”开头的错误码列表,详见错误码说明。 表1 API流控限制 接口分类 接口名称 单租户接口流控 (华北-北京四) 单租户接口流控 (华东-上海一) 单租户接口流控 (亚太-新加坡) 数字资产管理 创建资产 10次/秒 5次/秒 5次/秒 查询资产列表 20次/秒 10次/秒 10次/秒 更新资产 10次/秒 5次/秒 5次/秒 删除资产 10次/秒 5次/秒 5次/秒 查询资产详情 20次/秒 10次/秒 10次/秒 恢复被删除的资产 10次/秒 5次/秒 5次/秒 批量资产操作 1次/秒 1次/秒 1次/秒 查询资产概要 20次/秒 10次/秒 10次/秒 查询资产复制信息 20次/秒 10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒 5次/秒 5次/秒 创建大文件 10次/秒 5次/秒 5次/秒 视频制作剧本管理 创建视频制作剧本 10次/秒 5次/秒 5次/秒 查询视频制作剧本列表 20次/秒 10次/秒 10次/秒 查询视频制作剧本详情 20次/秒 10次/秒 10次/秒 更新视频制作剧本 10次/秒 5次/秒 5次/秒 删除视频制作剧本 10次/秒 5次/秒 5次/秒 复制视频制作剧本 10次/秒 5次/秒 5次/秒 数字人视频制作管理 查询视频制作任务列表 20次/秒 10次/秒 10次/秒 分身数字人视频制作管理 创建分身数字人视频制作任务 5次/秒 3次/秒 3次/秒 查询分身数字人视频制作任务详情 20次/秒 10次/秒 10次/秒 取消等待中的分身数字人视频制作任务 5次/秒 3次/秒 3次/秒 数字人名片制作管理 创建数字人名片制作 5次/秒 3次/秒 3次/秒 查询数字人名片制作任务列表 20次/秒 10次/秒 10次/秒 查询数字人名片制作任务详情 20次/秒 10次/秒 10次/秒 更新数字人名片制作 5次/秒 3次/秒 3次/秒 删除数字人名片制作任务 5次/秒 3次/秒 3次/秒 照片数字人视频制作管理 创建照片分身数字人视频制作任务 5次/秒 3次/秒 3次/秒 查询照片分身数字人视频制作任务详情 20次/秒 10次/秒 10次/秒 取消等待中的照片分身数字人视频制作任务 5次/秒 3次/秒 3次/秒 创建照片检测任务 5次/秒 3次/秒 3次/秒 查询照片检测任务详情 20次/秒 10次/秒 10次/秒 分身数字人字幕文件生成管理 创建分身数字人视频字幕文件 5次/秒 3次/秒 3次/秒 查询分身数字人视频字幕文件详情 20次/秒 10次/秒 10次/秒 智能直播间管理 创建智能直播间 5次/秒 3次/秒 3次/秒 查询智能直播间列表 20次/秒 10次/秒 10次/秒 查询智能直播剧本详情 20次/秒 10次/秒 10次/秒 更新智能直播间信息 5次/秒 3次/秒 3次/秒 删除智能直播间 4次/秒 3次/秒 3次/秒 创建智能直播间互动规则库 4次/秒 3次/秒 3次/秒 查询智能直播间互动规则库列表 20次/秒 10次/秒 10次/秒 更新智能直播间互动规则库 4次/秒 3次/秒 3次/秒 删除智能直播间互动规则库 4次/秒 3次/秒 3次/秒 直播任务管理 启动数字人智能直播任务 4次/秒 3次/秒 3次/秒 查询某个智能直播间下直播任务列表 20次/秒 10次/秒 10次/秒 查询数字人智能直播任务详情 20次/秒 10次/秒 10次/秒 结束数字人智能直播任务 4次/秒 3次/秒 3次/秒 控制数字人直播过程 4次/秒 3次/秒 3次/秒 查询租户所有数字人直播任务列表 10次/秒 5次/秒 5次/秒 上报直播间事件 4次/秒 3次/秒 3次/秒 直播商品管理 创建商品 4次/秒 3次/秒 3次/秒 查询商品列表 20次/秒 10次/秒 10次/秒 更新商品 4次/秒 3次/秒 3次/秒 查询商品详情 20次/秒 10次/秒 10次/秒 删除商品 4次/秒 3次/秒 3次/秒 商品资产组合配置 4次/秒 3次/秒 3次/秒 第三方直播平台管理 创建第三方直播平台 1次/秒 1次/秒 1次/秒 更新第三方直播平台信息 1次/秒 1次/秒 1次/秒 删除第三方直播平台信息 1次/秒 1次/秒 1次/秒 查询直播平台列表 20次/秒 10次/秒 10次/秒 查询第三方直播平台信息 20次/秒 10次/秒 10次/秒 查询第三方直播平台商品列表 5次/秒 3次/秒 3次/秒 智能交互数字人对话管理 创建智能交互对话 5次/秒 3次/秒 - 查询智能交互对话列表 20次/秒 10次/秒 10次/秒 查询智能交互对话详情 20次/秒 10次/秒 10次/秒 更新智能交互对话信息 5次/秒 3次/秒 - 删除智能交互对话 5次/秒 3次/秒 - 智能交互数字人对话任务管理 创建对话链接 5次/秒 3次/秒 - 启动数字人智能交互任务 5次/秒 3次/秒 - 结束数字人智能交互任务 5次/秒 3次/秒 - 查询数字人智能交互任务 20次/秒 10次/秒 10次/秒 智能交互数字人应用管理 创建应用 5次/秒 3次/秒 - 查询应用列表 20次/秒 10次/秒 10次/秒 查询应用详情 20次/秒 10次/秒 10次/秒 修改应用 5次/秒 10次/秒 - 删除应用 5次/秒 3次/秒 - 智能交互数字人鉴权码管理 创建一次性鉴权码 20次/秒 10次/秒 - 智能交互数字人激活码管理 创建激活码 5次/秒 3次/秒 - 查询激活码列表 20次/秒 10次/秒 10次/秒 查询激活码详情 20次/秒 10次/秒 10次/秒 修改激活码 5次/秒 3次/秒 - 重置激活码 5次/秒 3次/秒 - 删除激活码 5次/秒 3次/秒 - 智能交互数字人知识库技能管理 创建知识库技能 4次/秒 3次/秒 3次/秒 查询知识库技能列表 20次/秒 10次/秒 10次/秒 修改知识库技能 4次/秒 3次/秒 3次/秒 查询知识库技能详情 20次/秒 10次/秒 10次/秒 删除知识库技能 4次/秒 3次/秒 3次/秒 导出知识库技能 1次/秒 1次/秒 1次/秒 智能交互数字人知识库意图管理 创建知识库意图 4次/秒 3次/秒 3次/秒 查询知识库意图列表 20次/秒 10次/秒 10次/秒 查询知识库意图详情 20次/秒 10次/秒 10次/秒 修改知识库意图 4次/秒 3次/秒 3次/秒 删除知识库意图 4次/秒 3次/秒 3次/秒 创建知识库意图和问法 4次/秒 3次/秒 3次/秒 智能交互数字人知识库问法管理 创建知识库问法 4次/秒 3次/秒 3次/秒 查询知识库问法列表 20次/秒 10次/秒 10次/秒 查询知识库问法详情 20次/秒 10次/秒 10次/秒 修改知识库问法 4次/秒 3次/秒 3次/秒 删除知识库问法 4次/秒 3次/秒 3次/秒 批量创建知识库问法 1次/秒 1次/秒 1次/秒 批量修改知识库问法 1次/秒 1次/秒 1次/秒 智能交互数字人欢迎词管理 创建欢迎词 4次/秒 3次/秒 3次/秒 查询欢迎词列表 20次/秒 10次/秒 10次/秒 查询欢迎词详情 20次/秒 10次/秒 10次/秒 修改欢迎词 4次/秒 3次/秒 3次/秒 删除欢迎词 4次/秒 3次/秒 3次/秒 修改欢迎词功能开关 4次/秒 3次/秒 3次/秒 查询欢迎词功能开关 20次/秒 10次/秒 10次/秒 智能交互数字人热点问题管理 创建热点问题 4次/秒 3次/秒 3次/秒 查询热点问题列表 20次/秒 10次/秒 10次/秒 查询热点问题详情 20次/秒 10次/秒 10次/秒 修改热点问题 4次/秒 3次/秒 3次/秒 删除热点问题 4次/秒 3次/秒 3次/秒 智能交互数字人热词记录管理 创建热词记录 4次/秒 3次/秒 3次/秒 查询热词记录列表 20次/秒 10次/秒 10次/秒 查询配置热词记录详情 20次/秒 10次/秒 10次/秒 修改热词记录 4次/秒 3次/秒 3次/秒 删除热词记录 4次/秒 3次/秒 3次/秒 修改热词功能开关 4次/秒 3次/秒 3次/秒 查询热词功能开关 20次/秒 10次/秒 10次/秒 智能交互数字人委托管理 查询委托 20次/秒 10次/秒 10次/秒 创建委托 1次/秒 1次/秒 - 删除委托 1次/秒 1次/秒 - 分身形象制作管理 创建分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 查询分身数字人模型训练任务列表 20次/秒 10次/秒 10次/秒 查询分身数字人模型训练任务详情 20次/秒 10次/秒 10次/秒 删除分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 更新分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 租户执行分身数字人模型训练任务命令 10次/秒 3次/秒 3次/秒 声音制作任务管理 查询用户配置的个性化音频时长 20次/秒 10次/秒 10次/秒 创建基础版语音训练任务 10次/秒 3次/秒 3次/秒 创建进阶版语音训练任务 10次/秒 3次/秒 3次/秒 创建高级版语音训练任务 10次/秒 3次/秒 3次/秒 查询语音训练任务列表 20次/秒 10次/秒 10次/秒 提交语音训练任务 10次/秒 3次/秒 3次/秒 查询语音训练任务详情 20次/秒 10次/秒 10次/秒 删除语音训练任务 10次/秒 3次/秒 3次/秒 查询任务操作日志 20次/秒 10次/秒 10次/秒 获取语音文件上传地址 20次/秒 10次/秒 10次/秒 获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒 设置任务批次 10次/秒 3次/秒 3次/秒 确认在线录音结果 10次/秒 3次/秒 3次/秒 获取在线录音确认结果 20次/秒 10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件 20次/秒 10次/秒 10次/秒 创建TTS异步任务 5次/秒 3次/秒 3次/秒 获取TTS异步任务 20次/秒 10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理 查询数字人风格列表 20次/秒 10次/秒 - 3D数字人风格化照片建模 创建照片建模任务 2次/秒 2次/秒 - 照片建模任务列表查询 20次/秒 10次/秒 - 照片建模任务详情查询 20次/秒 10次/秒 - 基于图片URL创建照片建模任务 2次/秒 2次/秒 - 3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务 2次/秒 2次/秒 - 查询视频驱动任务列表 20次/秒 10次/秒 - 查询视频驱动任务详情 20次/秒 10次/秒 - 停止视频驱动任务 2次/秒 2次/秒 - 控制数字人驱动 2次/秒 2次/秒 - 表2 API流控限制 接口分类 接口名称 单租户接口流控 系统流控 租户管理 查看租户资源用量信息 10次/秒 20次/秒 查看租户资源列表 10次/秒 20次/秒 统计时间段内资源数量 10次/秒 20次/秒
  • 计费模式 数字内容生产线提供按需计费、包年/包月、一次性计费三种计费模式,以满足不同场景下的用户需求。 按需计费模式:包含按需和按需预付费套餐包两种计费方式。 按需计费:一种后付费模式,即先使用再付费。每个计费周期分别统计各资源的实际使用量,并根据使用量*单价的方式计算出费用,然后从账户余额中扣除对应金额。 按需预付费套餐包:您也可以通过按需预付费套餐包的方式,提前购买使用额度,获取更多的优惠。套餐包需要在有效期内使用,且超出套餐包的部分自动转按需计费。 包年/包月计费模式:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买周期越长,享受的折扣越大。一般适用于需求量长期稳定的成熟业务。 一次性计费:一次性预付费套餐包,由MetaStudio服务进行结算。