搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一些将无监督数据转换为有监督数据的方案，供您参考：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

中文简繁转换将简体文本转换为繁体，或将繁体文本转换为简体。符号标准化查找数据中携带的非标准化符号进行标准化、统一化转换。统一空格：将所有Unicode空格（如U+00A0、U+200A）转换为标准空格（U+0020）。全角转半角：将文本中的全角字符转换为半角字符。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

出更多的业务场景数据。示例如下：大模型输入：请改写命令案例，生成10个相似命令，保证每个命令都可以调用正确的指标接口。请注意： 1. 命令必须契合人类常见的提问方式，命令方式必须保证多样化 2. 生成的命令只能改写命令案例中文表达部分的内容指标接口名称：利润的平均值、市值的平均值

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

训练损失值是一种衡量模型预测结果和真实结果之间的差距的指标，通常情况下越小越好。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。困惑度用来衡量大语言模型预测一个语言样本的能力，数值越低，准确率也就越高，表明模型性能越好。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
获取图片类数据集评估报告 - 盘古大模型 PanguLargeModels

Studio大模型开发平台提供了详细的质量评估报告，帮助用户全面了解数据集的质量情况。获取数据集评估报告步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程 > 数据评估 > 评估任务”。单击操作列“报告”可以查看详细的质量评估报告。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估图片类数据集
获取视频类数据集评估报告 - 盘古大模型 PanguLargeModels

Studio大模型开发平台提供了详细的质量评估报告，帮助用户全面了解数据集的质量情况。获取数据集评估报告步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程 > 数据评估 > 评估任务”。单击操作列“报告”可以查看详细的质量评估报告。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估视频类数据集
获取文本类数据集评估报告 - 盘古大模型 PanguLargeModels

Studio大模型开发平台提供了详细的质量评估报告，帮助用户全面了解数据集的质量情况。获取数据集评估报告步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程 > 数据评估 > 评估任务”。单击操作列“报告”可以查看详细的质量评估报告。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估文本类数据集
查看提示词评估结果 - 盘古大模型 PanguLargeModels

查看提示词评估结果评估任务创建完成后，会跳转至“评估”页面，在该页面可以查看评估状态。图1 查看提示词评任务状态单击“评估名称”，进入评估任务详情页，可以查看详细的评估进度，例如在图2中有10条评估用例，当前已评估8条，剩余2条待评估。图2 查看评估进展评估完成后，可以查看每条数据的评估结果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

训练损失值是一种衡量模型预测结果和真实结果之间的差距的指标，通常情况下越小越好。这里代表高空Loss（深海Loss）和表面Loss（海表Loss）的综合Loss。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。高空Loss（深海Loss）

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
查看NLP大模型部署任务详情 - 盘古大模型 PanguLargeModels

查看NLP大模型部署任务详情部署任务创建成功后，可以在“模型开发 > 模型部署”页面查看模型的部署状态。当状态依次显示为“初始化 > 部署中 > 运行中”时，表示模型已成功部署，可以进行调用。此过程可能需要较长时间，请耐心等待。在此过程中，可单击模型名称可进入详情页，查看模

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 部署NLP大模型
管理盘古数据资产 - 盘古大模型 PanguLargeModels

用户发布的数据集会被纳入数据资产，集中存储在空间资产中。平台为数据资产提供了一系列管理功能，包括查看数据集的详细信息、追踪操作记录、以及数据集的删除管理等。这不仅便于用户对已发布数据集的集中管理，还可帮助用户了解每个数据集的使用情况，从而简化数据资产的维护更新流程。通过这样的统一管

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常评估模型效果的方法有很多，通常可以从以下几个方面来评估模型训练效果： Loss曲线：通过Loss曲线的变化趋势来评估训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
查看科学计算大模型部署任务详情 - 盘古大模型 PanguLargeModels

查看科学计算大模型部署任务详情部署任务创建成功后，可以在“模型开发 > 模型部署”页面查看模型的部署状态。当状态依次显示为“初始化 > 部署中 > 运行中”时，表示模型已成功部署，可以进行调用。此过程可能需要较长时间，请耐心等待。在此过程中，可单击模型名称可进入详情页，查看

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 部署科学计算大模型
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，根据实际情况调整训练参数，帮助模型更好学习。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
调试Agent应用 - 盘古大模型 PanguLargeModels

单击待调试的应用。单击应用右上侧的“调试详情”，进入调试详情页面。在调试详情页面，单击，选择需要查看的信息。单击“日志概览”页签。可以查看到该次执行的整体情况，包括执行状态、开始/结束时间、运行时长和输入/输出。单击“节点详情”页签。可以查看到该次执行的主要组件耗时时

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 手工编排Agent应用
为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化json数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。数据转换图文异常字符过滤将文本数据中携带的异常字符替换为空值，数据条目不变。不可见字符，比如U+0000-U+001F 表情符六网页标签符号<p>

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
使用盘古加工算子构建单轮问答数据集 - 盘古大模型 PanguLargeModels

场景描述此示例演示了如何使用加工算子轻松构建单轮问答数据集。数据集的加工算子是一种灵活的数据预处理工具，能够帮助您将原始数据转化为所需的格式。通过使用加工算子，您可以提取、转换、过滤原始数据，生成适合大模型训练的数据集。准备工作请提前准备数据并上传至OBS服务，上传步骤请详见通过控制台快速使用OBS。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门

总条数： 114

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

获取图片类数据集评估报告 - 盘古大模型 PanguLargeModels

获取视频类数据集评估报告 - 盘古大模型 PanguLargeModels

获取文本类数据集评估报告 - 盘古大模型 PanguLargeModels

查看提示词评估结果 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

查看NLP大模型部署任务详情 - 盘古大模型 PanguLargeModels

管理盘古数据资产 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型只能回答训练样本中的问题 - 盘古大模型 PanguLargeModels

查看科学计算大模型部署任务详情 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

调试Agent应用 - 盘古大模型 PanguLargeModels

为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同 - 盘古大模型 PanguLargeModels

气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

图片类加工算子能力清单 - 盘古大模型 PanguLargeModels

使用盘古加工算子构建单轮问答数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线