搜索_华为云

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

意义：确保数据质量和适配性数据发布功能通过数据评估和配比，确保发布的数据集满足大模型训练的高标准。这不仅包括数据规模的要求，还涵盖了数据质量、平衡性和代表性的保证，避免数据不均衡或不具备足够多样性的情况，进而提高模型的准确性和鲁棒性。提高数据的多样性和代表性通过合理的数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
大模型开发基本概念 - 盘古大模型 PanguLargeModels

行业经验，并更高效、准确地获取信息。大模型的计量单位token指的是什么令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

表面静态量默认包括地形高度、LAND_MASK和SOIL_TYPE，用于初始化模型状态并提供地表特性信息。当前不支持添加或去除这些静态量。 LAND_MASK：一个二维数组，表示模型网格中每个单元格是否是陆地。 SOIL_TYPE：表示地表土壤分类，影响土壤的物理和化学特性，如水分保持能力、热容量和导热性。模型输出控制参数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

准确性和智能化。例如，当用户提出复杂查询时，传统搜索引擎可能仅返回一系列相关链接，而大模型则能够理解问题的上下文，结合多个搜索结果生成简洁的答案，或提供更详细的解释，从而进一步改善用户的搜索体验。温度用于控制生成文本的多样性和创造力。调高温度会使得模型的输出更多样性和创新性。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 调用NLP大模型
编排应用 - 盘古大模型 PanguLargeModels

繁出现相同词汇。平衡的：平衡模型输出的随机性和准确性。创意性的：模型输出内容更具多样性和创新性，某些场景下可能会偏离主旨。自定义：自定义大模型输出的温度和核采样值，生成符合预期的输出。温度调高温度会使得模型的输出更多样性和创新性，反之，降低温度会使输出内容更加遵循指令要求但减少多样性，取值范围为0到1之间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
数据工程使用流程 - 盘古大模型 PanguLargeModels

为无标签数据集添加准确的标签，确保模型训练所需的高质量数据。平台支持人工标注和AI预标注两种方式，用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。发布数据集评估数据集平台预置了多种数据类型的基础评估标准，包括NLP、视频和图片数据，用户可根据需求选择预置标准或自定义评估标

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
功能总览 - 盘古大模型 PanguLargeModels

数据是大模型训练的基础，为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分，具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据流通和管理等功能。该工具链能够高效收集和处理各种格式的数据，满足不同训练和评测任务的需求。通过提供自动化的质量检测和

 帮助中心 > 盘古大模型 PanguLargeModels > 功能总览
什么是盘古大模型 - 盘古大模型 PanguLargeModels

数据是大模型训练的基础，为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分，具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据流通和管理等功能。该工具链能够高效收集和处理各种格式的数据，满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
应用场景 - 盘古大模型 PanguLargeModels

化的客户需求；个性化服务：基于大模型的智能客服能够学习和适应用户的行为模式和偏好，提供更加个性化的服务。农业科学计算大模型包括全球中期天气要素模型和降水模型，可以对未来一段时间的天气和降水进行预测，全球中期天气要素模型和降水模型能够在全球范围内进行预测，不仅仅局限于某个地区。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
编排工作流 - 盘古大模型 PanguLargeModels

用于控制生成结果的随机性。调高温度，会使得模型的输出更具多样性和创新性；降低温度，会使输出内容更加遵循指令要求，但同时也会减少模型输出的多样性。意图配置意图1 配置相关意图关键字信息。在意图输入框中输入意图描述信息，描述信息为针对该类别的描述语句或者关键词，也将作为大模型进行推理和分类的依据。意图数量为2 ~

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

训练指标说明模型训练指标指标说明科学计算大模型 Loss 训练损失值是一种衡量模型预测结果和真实结果之间的差距的指标，通常情况下越小越好。这里代表高空Loss（深海Loss）和表面Loss（海表Loss）的综合Loss。一般来说，一个正常的Loss曲线应该是单调递减的，即

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

例如，对于一些常见的问答场景（如常见百科问题），由于这些领域的相关数据广泛存在，模型通常能够较好地理解并生成准确回答。在这种情况下，通过调整提示词来引导模型的生成风格和细节，通常可以达到较好的效果。业务逻辑的复杂性判断任务场景的业务逻辑是否符合通用逻辑。如果场景中的业务逻辑较为简单、通用且易于理解，那么调整提示词是一个可行的方案。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

NLP大模型训练流程介绍 NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。针对预训练阶段，还

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
配比文本类数据集 - 盘古大模型 PanguLargeModels

配比文本类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通文本类数据集。创建文本类数据集配比任务创建文本类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
数据工程介绍 - 盘古大模型 PanguLargeModels

保数据能够高效、准确地为大模型的训练提供支持，帮助用户高效管理和处理数据，提升数据质量和处理效率，为大模型开发提供坚实的数据基础。数据工程包含的具体功能如下：数据获取：数据获取是数据工程的第一步，支持将不同来源和格式的数据导入平台。支持的接入方式：通过OBS服务导入数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据工程 - 盘古大模型 PanguLargeModels

提升数据治理的效率和效果。通过整合上述功能，数据工程在AI研发中不仅帮助用户高效构建高质量的训练数据集，还通过全流程的数据处理和管理，探索数据与模型性能的内在联系，为模型训练和应用提供坚实的数据基础，推动了模型的精确训练与持续优化，提升了AI应用开发的效率和成果的可靠性。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
查看预测大模型训练状态与指标 - 盘古大模型 PanguLargeModels

均方根误差是预测值与真实值之间差异的平方和的均值的平方根。它用于衡量模型预测值与实际值之间的偏差，数值越小，表明模型预测的精度越高。平均绝对误差平均绝对误差是预测值与真实值之间绝对误差的均值。它同样用于衡量模型预测值与实际值之间的差异，数值越小，表明模型预测的准确性越高。真实值和预测值真实值和预测值在图表中的对比情况。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

失、浪费和管理不善的情况？在社会建设专项资金的使用情况中，应规范操作，加强管理，及时纠正和化解建设过程中的解释、调取和留置问题，严防管理漏洞，保证应用资金的安全性和真实性。同时，应建立完善的监管机制，严格管理，加强监督，加强专项资金使用情况的评估，加强对建设过程的监管和评估，节约

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

率，降低能耗。油气行业：进行地质分层，例如基于地质数据，对不同地层进行分类，识别储层和非储层，提高勘探和开发效率。进行岩性识别，例如对不同岩石类型进行分类，帮助识别岩石的性质和特征，指导钻井和开采。进行流体识别，例如根据测井数据，识别储层中的油、气、水等流体类型。 2024年1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型

总条数： 66

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

编排应用 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

功能总览 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

编排工作流 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

配比文本类数据集 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

查看预测大模型训练状态与指标 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

预测大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线