搜索_华为云

加工图片类数据集 - 盘古大模型 PanguLargeModels

在右侧“加工步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据加工任务时，可直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的加工步骤。图2 选择加工模板

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
加工文本类数据集 - 盘古大模型 PanguLargeModels

在右侧“加工步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。图1 算子编排在编排过程中，可单击右上角“保存为新模板”将当前编排流程保存为模板。后续创建新的数据加工任务时，可直接单击“选择加工模板”进行使用。若选择使用加工模板，将删除当前已编排的加工步骤。图2 选择加工模板

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

加工，从而进一步优化数据处理流程，提高模型的准确性和鲁棒性。数据合成利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。数据标注为无标签数据集添加准确的标签，确保模型训练所需的高质量数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
状态码 - 盘古大模型 PanguLargeModels

地址的列表用于用户终端（例如：浏览器）选择。 301 Moved Permanently 永久移动，请求的资源已被永久的移动到新的URI，返回信息会包括新的URI。 302 Found 资源被临时移动。 303 See Other 查看其他地址，使用GET和POST请求查看。 304

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
数据工程使用流程 - 盘古大模型 PanguLargeModels

用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。合成数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。标注数据集为无标签数据集添加准确的标签，确保模型训练所需的高质量

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
视频类加工算子介绍 - 盘古大模型 PanguLargeModels

片段的长度超过设定的时间阈值，该镜头片段将按时长进行进一步拆分。数据过滤视频裁剪裁剪视频中字幕/Logo/水印/黑框等无用信息，生成新视频。视频元数据过滤基于视频元数据进行过滤，包括帧率、分辨率和视频时长。注：电影标准帧率为24或30FPS。宽高比过滤根据视频的宽高比进行过滤。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

进行推理服务。此时要考虑到模型的响应时间和并发能力。模型监控与迭代：部署后的模型需要持续监控其性能，并根据反馈进行定期更新或再训练。随着新数据的加入，模型可能需要进行调整，以保证其在实际应用中的表现稳定。在应用阶段，除了将模型嵌入到具体业务流程中外，还需要根据业务需求不断对模型进行优化，使其更加精准和高效。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
订购盘古大模型服务 - 盘古大模型 PanguLargeModels

模型资产基础上订购新的模型资产，增购完成后支持使用多个模型资产。增购模型资产的步骤如下：登录ModelArts Studio大模型开发平台，单击页面右上角“订购管理”。在“订购管理”页面，单击右上角“新增订购”。在“订购”页面，参考订购模型与资源完成新的模型资产增购。续订资源

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

话题重复度控制（presence_penalty） -2~2 0 话题重复度控制主要用于控制模型输出的话题重复程度。参数设置正值，模型倾向于生成新的、未出现过的内容；参数设置负值，倾向于生成更加固定和统一的内容。如果您没有专业的调优经验，可以优先使用建议，再结合推理的效果动态调整。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

除噪声、冗余信息等，提升数据质量。加工文本类数据集合成文本类数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。合成文本类数据集标注文本类数据集为无标签数据集添加准确的标签，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
数据工程 - 盘古大模型 PanguLargeModels

练的标准。数据合成：平台支持利用预置或自定义的数据指令对预训练文本、单轮问答、单轮问答（人设））数据集类型进行处理，并根据设定的轮数生成新数据。通过数据合成技术，可以生成大量高质量的训练数据，这些数据可以用于大模型的预训练，增强模型的泛化能力和性能。数据标注：平台支持对无标签

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程介绍 - 盘古大模型 PanguLargeModels

加工算子，以确保数据符合模型训练的标准和业务需求。数据合成：数据合成利用预置或自定义的数据指令对原始数据集进行处理，并根据设定的轮数生成新的数据。数据标注：数据标注旨在为无标签的数据集添加准确的标签，标注数据的质量直接影响模型的训练效果和精度。针对不同数据集平台支持人工标注与AI预标注两种形式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
优化推理超参数 - 盘古大模型 PanguLargeModels

话题重复度控制（presence_penalty） -2~2 0 话题重复度控制主要用于控制模型输出的话题重复程度。参数设置正值，模型倾向于生成新的、未出现过的内容；参数设置负值，倾向于生成更加固定和统一的内容。如果您没有专业的调优经验，可以优先使用建议，再结合推理的效果动态调整。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

载步骤示例如下：注册并登录数据下载平台，在高空变量数据下载链接中： Product type选择Reanalysis。 Variable新选择Geopotential、Specific humidity、Temperature、U-component of wind、V-component

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
编排工作流 - 盘古大模型 PanguLargeModels

单击“且”或“或”，可以切换该分支表达式的运算逻辑。 ELSE 该参数将不满足其他条件分支的内容输出，并提供给后序节点的输出参数引用。添加分支可以添加新的分支ELSE IF，新分支的配置方式与IF分支相同。图5 判断节点配置示例节点配置完成后，单击“确定”。连接判断节点和其他节点。代码节点配置说明

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

设置训练数据的高空变量信息。在“预训练”场景中，可以添加或去除新的高空变量，选中后会在变量权重中增加或移除该变量，训练任务将根据配置的高空变量重新训练模型。表面变量设置训练数据的表面变量信息。在“预训练”场景中，可以添加或去除新的表面变量，选中后会在变量权重中增加或移除该变量，训练任务将根据配置的表面变量重新训练模型。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
手动编排应用 - 盘古大模型 PanguLargeModels

详见创建与管理插件、编排工作流、创建与管理知识库。应用编排流程见表1。表1 应用编排流程操作步骤说明步骤1：创建应用创建一个新应用。步骤2：配置提示词在应用中配置大模型所需的Prompt。步骤3：添加插件为应用添加插件技能。步骤4：添加工作流为应用添加工作流技能。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
优化训练数据的质量 - 盘古大模型 PanguLargeModels

dQA2）、英文医疗问答数据集（webMedQA）、中医问答数据集（Huatuo-26M）等开源数据集。合成数据生成：利用现有数据生成新的数据实例。例如，通过指令泛化、相似指令生成等手段扩充数据多样性。 ModelArts Studio平台已经集成数据合成任务，创建文本类数据集合成任务步骤如下：

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
文本对话 - 盘古大模型 PanguLargeModels

Float 用于调整模型对新Token的处理方式。即如果一个Token已经在之前的文本中出现过，那么模型在生成这个Token时会受到一定的惩罚。当presence_penalty的值为正数时，模型会更倾向于生成新的、未出现过的Token，即模型会更倾向于谈论新的话题。最小值：-2 最大值：2

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > NLP大模型
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

针对预训练阶段，还可以继续进行训练，这一过程称为增量预训练。增量预训练是在已经完成的预训练的基础上继续训练模型。增量预训练旨在使模型能够适应新的领域或数据需求，保持其长期的有效性和准确性。微调阶段：基于预训练的成果，微调阶段通过在特定领域的数据集上进一步训练，使模型能够更有效地应

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型

总条数： 41

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

加工图片类数据集 - 盘古大模型 PanguLargeModels

加工文本类数据集 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

视频类加工算子介绍 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

订购盘古大模型服务 - 盘古大模型 PanguLargeModels

如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

优化推理超参数 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

编排工作流 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

手动编排应用 - 盘古大模型 PanguLargeModels

优化训练数据的质量 - 盘古大模型 PanguLargeModels

文本对话 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线