搜索_华为云

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

ERA5是由欧洲中期天气预报中心（ECMWF）提供的全球气候的第五代大气再分析数据集，它覆盖从1940年1月至今的时间段，提供每小时的大气、陆地和海洋气候变量的估计值。 ERA5数据下载官方指导：https://confluence.ecmwf.int/display/CKB/

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
创建文本类数据集标注任务 - 盘古大模型 PanguLargeModels

标注管理”，单击页面右上角“创建标注任务”。图2 标注管理在“创建标注任务”页面选择需要标注的加工后的文本类数据集，并设置标注项。设置标注项时，不同类型的数据文件对应的标注项也有所差异，可基于页面提示进行设置。图3 创建标注任务单击“下一步”设置标注人员及信息，单击“完成创建”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 标注数据集 > 标注文本类数据集
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

计算出来的最低值。热身比例热身比例是指在模型训练过程中逐渐增加学习率的过程。在训练的初始阶段，模型的权重通常是随机初始化的，此时模型的预测能力较弱。如果直接使用较大的学习率进行训练，可能会导致模型在初始阶段更新过快，从而影响模型的收敛。为了解决这个问题，可以在训练的初始阶段

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
调试Agent应用 - 盘古大模型 PanguLargeModels

参数说明模型选择选择要使用的LLM，不同的模型效果存在差异。模式选择用于配置大模型的输出多样性。包含取值：精确的：模型的输出内容严格遵循指令要求，可能会反复讨论某个主题，或频繁出现相同词汇。平衡的：平衡模型输出的随机性和准确性。创意性的：模型输出内容更具多样性和创新性，某些场景下可能会偏离主旨。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 手工编排Agent应用
数据工程使用流程 - 盘古大模型 PanguLargeModels

高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的采集、清洗、标注、评估、发布等环节，成为数据开发中不可或缺的重要步骤。在ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

创建文本类数据集加工任务上线加工后的数据集对加工后的数据集执行上线操作。上线加工后的文本类数据集标注数据集（可选）创建文本类数据集标注任务创建数据集标注任务，对数据集执行标注操作，标注后的数据可以用于模型训练或评测。创建文本类数据集标注任务审核数据集标注结果对数据集的标注结果进行审核

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
从基模型训练出行业大模型 - 盘古大模型 PanguLargeModels

从基模型训练出行业大模型打造短视频营销文案创作助手打造政务智能问答助手基于NL2JSON助力金融精细化运营

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践
什么是提示词工程 - 盘古大模型 PanguLargeModels

言模型的安全性，还可以赋能大语言模型，如借助专业领域知识和外部工具来增强大语言模型的能力。提示词基本要素您可以通过简单的提示词（Prompt）获得大量结果，但结果的质量与您提供的信息数量和完善度有关。一个提示词可以包含您传递到模型的指令或问题等信息，也可以包含其他种类的信息，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

ss（损失函数值）的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标，正常情况下越小越好。您可以从平台的训练日志中获取到每一步的Loss，并绘制成Loss曲线，来观察其变化趋势。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

温度主要用于控制模型输出的随机性和创造性。温度越高，输出的随机性和创造性越高；温度越低，输出结果越可以被预测，确定性相对也就越高。您可根据真实的任务类型进行调整。一般来说，如果目标任务的需要生成更具创造性的内容，可以使用较高的温度，反之如果目标任务的需要生成更为确定的内容，可以使用较低的温度。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

意输出格式中的key不要有语义重复，并且需要与前文要求中的key名字保持一致，否则模型会不理解是同一个key。恰当的表述可以尝试从英语的逻辑去设计提示词。最好是主谓宾结构完整的句子，少用缩写和特殊句式。应使用常见的词汇和语言表达方式，避免使用生僻单词和复杂的句式，防止机器理解偏差。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
权限管理 - 盘古大模型 PanguLargeModels

权限管理如果您需要对华为云上购买的盘古大模型资源，为企业中的员工设置不同的访问权限，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（IAM）和盘古角色管理功能进行精细的权限管理。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户（子用户）进行权限管理，您可

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

10TB。问答排序 jsonl、csv jsonl格式：context表示问题，targets的回答1、回答2、回答3表示答案的优劣顺序，最好的答案排在最前面。targets内容的数量至少为2个，且最多为6个，具体格式示例如下： { "context":"context内容","targets":["回答1"

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
返回结果 - 盘古大模型 PanguLargeModels

深感敬佩。在宋朝的生活中，李晓也遇到了许多困难。他必须适应新的食物，新的气候，甚至新的疾病。但是，他从未放弃，他始终坚信，只要他坚持下去，他就能适应这个新的世界。在宋朝的生活中，李晓也找到了新的目标。他开始学习宋朝的书法，尝试理解这个时代的艺术。他还开始学习宋朝的医学，尝试理解这

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
认证鉴权 - 盘古大模型 PanguLargeModels

Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。如果您的华为云账号已升级

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

等服务，便捷地构建自己的模型和应用数据工程工具链：数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分，具备数据获取、清洗、配比和管理等功能，确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据，满足不同训练任务的需求，并提供强大的数据存储和管理能力，为大模型训练提供坚实的数据支持。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成了复读机式的结果，即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“话题重复度控制”或“温度”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中一个参数的值，可以提升模型回答的确定性，避免生成异常内容。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题当您将微调的模型部署以后，输入一个已经出现在训练样本中的问题，模型生成的结果很好，一旦输入了一个从未出现过的数据（目标任务相同），回答却完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题

总条数： 69

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

创建文本类数据集标注任务 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

调试Agent应用 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

从基模型训练出行业大模型 - 盘古大模型 PanguLargeModels

什么是提示词工程 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

权限管理 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线