搜索_华为云

数据工程使用流程 - 盘古大模型 PanguLargeModels

高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的获取、加工、合成、标注、配比、评估、发布等环节，成为数据开发中不可或缺的重要步骤。数据工程操作流程见图1、表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据预处理优化 - 盘古大模型 PanguLargeModels

通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。结合数据自身特征，进行异常数据的筛选。对于异常值，视情况进行删除、替换、保留等操作，兼顾模型的收敛与鲁棒性。优化举例：某数据集中，盐度（S）变量在下载过程中存在数据块缺失与数据块偏移的问题，如图1、图2，导致在训练过程中盐度

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

服务，便捷地构建自己的模型和应用。数据工程工具链：数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分，具备数据获取、数据加工和数据发布等功能，确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据，满足不同训练任务的需求，并提供强大的数据存储和管理能力，为大模型训练提供坚实的数据支持。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

两种方式，用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。标注文本类数据集配比文本类数据集数据配比是将多个数据集按特定比例组合的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。配比文本类数据集发布文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
Agent开发平台介绍 - 盘古大模型 PanguLargeModels

Agent开发平台是基于NLP大模型，致力打造智能时代集开发、调测和运行为一体的AI应用平台。无论开发者是否拥有大模型应用的编程经验，都可以通过Agent平台快速创建各种类型的智能体。Agent开发平台旨在帮助开发者高效低成本的构建AI应用，加速领域和行业AI应用的落地。针对“零码”开发者（无代码开发经验），

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优模型微调参数的选择没有标准答案，不同的场景，有不同的调整策略。一般微调参数的影响会受到以下几个因素的影响：目标任务的难度：如果目标任务的难度较低，模型能较容易的学习知识，那么少量的训练轮数就能达到较好的效果。反之，若任务较复杂，那么可能就需要更多的训练轮数。数据量级：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
优化训练超参数 - 盘古大模型 PanguLargeModels

优化训练超参数模型微调超参数的选择没有标准答案，不同的场景，有不同的调整策略。一般微调参数的影响会受到以下几个因素的影响：目标任务的难度：如果目标任务的难度较低，模型能较容易的学习知识，那么少量的训练轮数就能达到较好的效果。反之，若任务较复杂，那么可能就需要更多的训练轮数。数据量级：

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：如果学习率过大，模型可能无法收敛。如果学习率过小，模型的收敛速度将变得非常慢。训练轮数表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。 Lora矩阵的轶较高的取值意味着更多的参数被更新，模型具有更大的灵活性，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
微调典型问题 - 盘古大模型 PanguLargeModels

通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。结合数据自身特征，进行异常数据的筛选。对于异常值，视情况进行删除、替换、保留等操作，兼顾模型的收敛与鲁棒性。删除异常值后，盐度（S）损失收敛正常，如图4。表2 验证集选择的时间区段时间分辨率推理步数验证集选择的时间区段(验证集需要至少在以下时间点内，有连续数据

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
调优典型问题 - 盘古大模型 PanguLargeModels

通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。结合数据自身特征，进行异常数据的筛选。对于异常值，视情况进行删除、替换、保留等操作，兼顾模型的收敛与鲁棒性。删除异常值后，盐度（S）损失收敛正常，如图4。表2 验证集选择的时间区段时间分辨率推理步数验证集选择的时间区段（需要至少在以下

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

让模拟出的天气接近真实世界中的变化。 CNOP噪音通过在初始场中引入特定的扰动来研究天气系统的可预报性，会对扰动本身做一定的评判，能够挑选出预报结果与真实情况偏差最大的一类初始扰动。这些扰动不仅可以用来识别最可能导致特定天气或气候事件的初始条件，还可以用来评估预报结果的不确定性。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

ERA5是由欧洲中期天气预报中心（ECMWF）提供的全球气候的第五代大气再分析数据集，它覆盖从1940年1月至今的时间段，提供每小时的大气、陆地和海洋气候变量的估计值。 ERA5数据下载官方指导：https://confluence.ecmwf.int/display/CKB/

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
大模型使用类 - 盘古大模型 PanguLargeModels

大模型使用类盘古大模型是否可以自定义人设如何将本地的数据上传至平台导入数据过程中，为什么无法选中OBS的单个文件进行上传如何查看预置模型的历史版本训练/推理单元与算力的对应关系是什么

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
工作流介绍 - 盘古大模型 PanguLargeModels

作为节点的输出。判断节点：编排应用时作为分支切换节点，可以根据输入满足的判断条件，指定执行对应的工作流分支。代码节点：用于引入代码执行器，根据节点的输入，执行指定Python代码，节点的输出是代码执行的结果信息。知识检索节点：可以根据输入参数从指定知识库内召回匹配的信息。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

Face团队推出的一种大模型请求格式。接口的响应体需要按照jsonpath语法要求进行填写，jsonpath语法的作用是从响应体的json字段中提取出所需的数据。评测配置评测类型选择“自动评测”。评测规则选择“基于规则”。评测数据集评测模板：使用预置的专业数据集进行评测。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

强模型的泛化能力。取值范围：[0,1]。给输入数据加噪音的尺度给输入数据加噪音的尺度，定义了给输入数据加噪音的尺度。这个值越大，添加的噪音越强烈，模型的正则化效果越强，但同时也可能会降低模型的拟合能力。取值范围：[0,1]。给输出数据加噪音的概率给输出数据加噪音的概率，定

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

Models）通常指的是具有海量参数和复杂结构的深度学习模型，广泛应用于自然语言处理（NLP）等领域。开发一个大模型的流程可以分为以下几个主要步骤：数据集准备：大模型的性能往往依赖于大量的训练数据。因此，数据集准备是模型开发的第一步。首先，需要根据业务需求收集相关的原始数据，确保数据的覆盖面和多样性。例如

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
大模型开发基本概念 - 盘古大模型 PanguLargeModels

多样性和一致性是评估LLM生成语言的两个重要方面。多样性指模型生成的不同输出之间的差异。一致性指相同输入对应的不同输出之间的一致性。重复惩罚重复惩罚（repetition_penalty）是在模型训练或生成过程中加入的惩罚项，旨在减少重复生成的可能性。通过在计算损失函数（用于优化模型的指标）时增加

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

用、监管有力的制度，并加强对专项资金的监督和管理。严格控制专项资金的流向和使用范围，严禁有过度功能的行为，坚决杜绝虚假、虚报和恶意投资，建立完善的监督管理制度，加强随时的监督和核查，确保专项资金使用的规范化、严格化、透明化、便结算。”问题：在福田区社会建设专项资金的使用过程中，如

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
构建微调训练任务数据集 - 盘古大模型 PanguLargeModels

科学计算大模型微调训练所需的数据为气象再分析数据。气象再分析数据集是利用现代数值天气预报模型和数据同化系统，对过去的观测数据进行重新处理后得到的。这些数据集可以是全球范围的，也可以是特定区域的。再分析数据集的目的是通过整合历史观测数据和现代计算技术，提供一个完整、统一且高质量的气象数据记录，

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践

总条数： 233

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

数据工程使用流程 - 盘古大模型 PanguLargeModels

数据预处理优化 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

Agent开发平台介绍 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

优化训练超参数 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

微调典型问题 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

大模型使用类 - 盘古大模型 PanguLargeModels

工作流介绍 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

构建微调训练任务数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线