搜索_华为云

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳提示词与训练数据的相似度关系。提示词的效果通常与训练数据的相似度密切相关。当提示词的内容与模型在训练过程中接触过的样本数据相似时，模型更容易理解提示词并生成相关的输出。这是因为模型通过学习大量的训练数据，逐渐建立起对特定模式、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

情况调整训练参数，帮助模型更好学习。 Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格：理论上模型的参数规模越大，模型能学到的知识就越多，能学会的知识就更难，若目标任务本身

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

果，即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“话题重复度控制”或“温度”或“核采样”等参数的设置，适当增大其中一个参数的值，可以提升模型回答的多样性。数据质量：请检查训练数据中是否存在文本重复的异常数据，可以通过规则进行清洗。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

推理参数（解码参数）是一组用于控制模型生成预测结果的参数，其可以用于控制模型生成结果的样式，如长度、随机性、创造性、多样性、准确性和丰富度等等。当前，平台支持的推理参数包括：温度、核采样以及话题重复度控制，如下提供了这些推理参数的建议值和说明，供您参考：表1 推理参数的建议和说明推理参数范围建议值说明

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
创建图片类数据集评估标准 - 盘古大模型 PanguLargeModels

创建图片类数据集评估标准 ModelArts Studio大模型开发平台针对图片数据集预设的一套评估标准，涵盖了图像清晰度、分辨率、标签准确性、图像一致性等多个质量维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准，可跳过此章节至创建图片类数据集评估任务。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估图片类数据集
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

提示词写作常用方法论打基础先制定一个能够明确表达主题的提示词（若模型训练时包含相似任务，可参考模型训练使用的提示词），再由简至繁，逐步增加细节和说明。打好基础是后续提示词优化的前提，基础提示词生成效果差，优化只会事倍功半。例如，文学创作类可以使用“请创作一个关于{故事主题}

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

目录下只有1个数据文件时，文件无命名要求。目录下有多个数据文件时，需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字眼，如train01.csv；验证数据名称需包含eval字眼；测试数据名称需包含test字眼。文件的命名不能同时包含train、eval和test中的两个或三个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

指的是噪音的频率，在生成Perlin噪音时，可以将多个不同频率的噪音叠加在一起，以增加噪音的复杂度和细节。每个频率的噪音称为一个octave，而叠加的octave数越多，噪音的复杂度也就越高。 ensemble_noise_perlin_y 用于选择集合预报的Perlin加噪y纬度方向的尺度。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型
创建视频类数据集评估标准 - 盘古大模型 PanguLargeModels

创建视频类数据集评估标准 ModelArts Studio大模型开发平台针对视频数据集预设了一套评估标准，涵盖了视频的清晰度、帧率、完整性、标签准确性等多个质量维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准，可跳过此章节至创建视频类数据集评估任务。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集 > 评估视频类数据集
数据集评估场景介绍 - 盘古大模型 PanguLargeModels

的数据支持。视频数据质量标准 V1.0：ModelArts Studio大模型开发平台针对视频数据集预设了一套评估标准，涵盖了视频的清晰度、帧率、完整性、标签准确性等多个质量维度。该标准帮助用户评估和优化视频数据的质量，确保数据符合大模型训练的要求，提升模型的精度与可靠性。用户

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集
使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

控制生成文本多样性和质量。调高核采样可以使输出结果更加多样化。最大口令限制用于控制聊天回复的长度和质量。话题重复度控制用于控制生成文本中的重复程度。调高参数模型会更频繁地切换话题，从而避免生成重复内容。词汇重复度控制用于调整模型对频繁出现的词汇的处理方式。调高参数会使模型减少相同词汇的重复使用，促使模型使用更多样化的词汇进行表达。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 调用NLP大模型
理解底层任务 - 盘古大模型 PanguLargeModels

识。例如，在构造泛化问题的任务中，需要基于原问题改写为相同含义的问题，而不是生成相似的问题。当提示词使用“请生成10个跟“手机银行怎么转账”相似的问题”时，模型会认为实体/关键词/场景一致则是相似（在这个例子里实体为手机银行），而不是任务需要的语义级别的相同含义，所以输出内容会发散。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

个较小的值。困惑度用来衡量大语言模型预测一个语言样本的能力，数值越低，准确率也就越高，表明模型性能越好。指标看板 bleu-1：模型生成句子与实际句子在单字层面的匹配度，数值越高，表明模型性能越好。 bleu-2：模型生成句子与实际句子在词组层面的匹配度，数值越高，表明模型性能越好。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

问题二：模型生成的文案中重复讨论一个相同的话题。解决方案：对于这种情况，可以尝试修改推理参数。例如，降低“话题重复度控制”参数的值。若调整推理参数不生效，则检查数据质量，确认数据中不存在重复数据和高度相似数据。父主题：从基模型训练出行业大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

avi或.mp4格式，标注格式为.json。必须包含两个及以上后缀名字为avi或mp4的文件。每个视频时长要大于128s，FPS>=10，且测试集训练集都要有视频。数据集最大100万个文件，单文件最大10GB，整个数据集最大10TB。支持视频的格式包括常见的mp4和或avi格式文

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 数据集格式要求
文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

段落结尾不完整句子过滤删除文本中不完整段落和句子。广告数据过滤删除文本中包含广告数据的句子。全局文本去重检测并去除数据中重复或高度相似的文本，防止模型过拟合或泛化性降低。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

对视频的基础质量（清晰度、亮度、模糊、画面抖动重影、低光过曝、花屏等）进行评分。分值范围(0, 1)，数值越高质量越好，评分>0.05可认为是视频基础质量较高的视频。美学评分从内容（吸引人，清晰度）、构图（目标物位置良好）、颜色（有活力，令人愉悦）、光线（光线明显有对比度）、轨迹（连续

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

景复杂或专业，则需要上万条数据。数据质量要求：保证数据的分布和目标需要与实际场景匹配。保证数据的覆盖度：数据需要尽可能覆盖产品所提供的功能；数据需要覆盖难易度、长短度，包含参数丰富等场景；数据在长短、扁平与深层嵌套、对接客户api接口数量上全覆盖。数据中需要提供JSON的

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型

总条数： 28

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

创建图片类数据集评估标准 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

创建视频类数据集评估标准 - 盘古大模型 PanguLargeModels

数据集评估场景介绍 - 盘古大模型 PanguLargeModels

使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

理解底层任务 - 盘古大模型 PanguLargeModels

查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线