搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

能达到较好的效果。反之，若任务较复杂，那么可能就需要更多的训练轮数。数据量级：如果微调数据很多，从客观上来说越多的数据越能接近真实分布，那么可以使用较大的学习率和较大的批量大小，以提高训练效率。如果微调数据量相对较少，则可以使用较小的学习率和较小的数据批量大小，避免过拟合。通

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常判断训练状态是否正常，通常可以通过观察训练过程中Loss（损失函数值）的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标，正常情况下越小越好。您可以从平台的训练日志中获取到每一步的Loss，并绘制成Loss曲线，来观察其变化

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

盘古大模型是否可以自定义人设大模型支持设置人设，在用户调用文本对话（chat/completions）API时，可以将“role”参数设置为system，让模型按预设的人设风格回答问题。以下示例要求模型以幼儿园老师的风格回答问题： { "messages": [

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常评估模型效果的方法有很多，通常可以从以下几个方面来评估模型训练效果： Loss曲线：通过Loss曲线的变化趋势来评估训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

明模型性能越好。 BLEU-1 模型生成句子与实际句子在单字层面的匹配度，数值越高，表明模型性能越好。 BLEU-2 模型生成句子与实际句子在词组层面的匹配度，数值越高，表明模型性能越好。 BLEU-4 模型生成结果和实际句子的加权平均精确率，数值越高，表明模型性能越好。 ROUGE-1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
大模型开发基本概念 - 盘古大模型 PanguLargeModels

f(x))来表示，损失函数越小，模型的鲁棒性就越好。推理相关概念表3 训练相关概念说明概念名说明温度系数温度系数（temperature）控制生成语言模型中生成文本的随机性和创造性，调整模型的softmax输出层中预测词的概率。其值越大，则预测词的概率的方差减小，即很多词被选择的可能性增大，利于文本多样化。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、案

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍大模型（Large Models）通常指的是具有海量参数和复杂结构的深度学习模型，广泛应用于自然语言处理（NLP）等领域。开发一个大模型的流程可以分为以下几个主要步骤：数据集准备：大模型的性能往往依赖于大量的训练数据。因此，数据集准备是模型开发的第一步。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
大模型微调训练类问题 - 盘古大模型 PanguLargeModels

大模型微调训练类问题无监督领域知识数据量无法支持增量预训练，如何进行模型学习如何调整训练参数，使盘古大模型效果最优如何判断盘古大模型训练状态是否正常如何评估微调后的盘古大模型是否正常如何调整推理参数，使盘古大模型效果最优为什么微调后的盘古大模型总是重复相同的回答为什么微调后的盘古大模型的回答中会出现乱码

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

多轮问答（人设） jsonl 训练NLP大模型所需数据量使用数据工程构建盘古NLP大模型数据集进行模型训练时，所需数据量见表2。表2 构建NLP大模型所需数据量模型规格训练类型推荐数据量最小数据量（数据条数）单场景推荐训练数据量单条数据Token长度限制 N1 微调 -

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

这个值越大，删除的路径越多，模型的正则化效果越强，但同时也可能会降低模型的拟合能力。取值范围：[0，1）。特征删除概率用于定义特征删除机制中的删除概率。特征删除（也称为特征丢弃）是另一种正则化技术，它在训练过程中随机删除一部分的输入特征，以防止模型过拟合。这个值越大，删除的

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

自定义L1预训练模型目录自定义预训练模型所在的OBS路径。训练轮数表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。是否使用自定义L1预训练模型是否使用自定义预训练模型进行训练，模型为用户与服务共建，详情请联系客服。热身轮次表示在模型训练初期，逐步增加学习率到预设值的

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
产品优势 - 盘古大模型 PanguLargeModels

是文本分类、情感分析、机器翻译，还是问答系统，模型都能以高准确率完成任务，为用户提供高质量的输出结果。这种卓越的表现源于其先进的算法和深度学习架构。盘古大模型能够深入理解语言的内在逻辑与语义关系，因此在处理复杂语言任务时展现出更高的精准度和效率。这不仅提高了任务的成功率，也大幅

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
同一资源是否同时支持包年/包月和按需计费两种模式 - 盘古大模型 PanguLargeModels

同一资源是否同时支持包年/包月和按需计费两种模式盘古大模型的模型订阅、数据托管单元、推理单元默认采用包周期计费。数据智算单元、数据通算单元默认采用按需计费。训练单元采用包周期和按需计费两种方式。两种计费方式不能共存，只支持按照一种计费方式进行订购。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

1)，数值越高美感越好，评分>0.95可视为视频基础质量较高的视频。水印识别识别视频中是否包含水印。字幕识别识别视频中是否包含字幕。 Logo识别识别视频中是否包含Logo。视频黑边识别识别视频中是否包含黑边。密集文字识别识别视频中是否包含密集文字，达到密集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
约束与限制 - 盘古大模型 PanguLargeModels

等，请参考《用户指南》“使用数据工程构建数据集 > 数据集格式要求”。模型开发-训练、评测最小数据量要求使用ModelArts Studio平台训练、评测不同模型时，存在不同数据量的限制。以NLP大模型为例，请参考《用户指南》“开发盘古NLP大模型 > 使用数据工程构建NLP大模型数据集”。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
包年/包月和按需计费模式是否支持互相切换 - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式是否支持互相切换包年/包月和按需计费模式支持互相切换：盘古大模型提供包周期计费、按需计费两种计费模式，两种计费模式可通过重新订购互相切换。例如，退订训练单元的包周期资源后，可重新订购训练单元的按需计费，即可完成切换。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ

总条数： 88

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

大模型微调训练类问题 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

同一资源是否同时支持包年/包月和按需计费两种模式 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

约束与限制 - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式是否支持互相切换 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线