搜索_华为云

流通视频类数据集 - 盘古大模型 PanguLargeModels

流通视频类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。视频类数据集当前仅支持发布为“默认格式”。创建视频类数据集流通任务创建视频类数据集流通任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
资源到期了如何续费 - 盘古大模型 PanguLargeModels

资源到期了如何续费包年/包月方式购买的资源到期后，请在平台订购管理页面进行续订操作。具体步骤如下：登录ModelArts Studio大模型开发平台，单击页面右上角“订购管理”。在“订购管理”页面，单击“资源订购”页签。在“资源订购”页签可进行数据资源、训练资源、推理资源的续费操作。

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

若目标任务本身需要生成的长度已经超过模型上限，建议您替换可支持更长长度的模型。数据质量：请检查训练数据中是否存在包含异常截断的数据，可以通过规则进行清洗。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。数据标注为无标签数据集添加准确的标签，确保模型训练所需的高质量数据。平台支持人工标注和AI预标注两种方式，用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。通过这

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

2024年11月发布的版本，仅支持模型增量预训练。32个训练单元起训，预训练后的模型版本需要通过微调之后，才可支持推理部署。 Pangu-NLP-N2-Chat-32K-20241030 32K 4K 2024年10月发布版本，支持8K序列长度训练，4K/32K序列长度推理。全量微调32个训练单元起训，LoR

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

他类数据集格式要求。表1 训练CV大模型数据集类型要求基模型训练场景文件内容文件格式盘古-CV-物体检测-N 微调图片+检测标注图片+xml 训练CV大模型所需数据量初期启动训练时，每种模型类别先提供1000张已标注的图片数据进行训练，后续根据验证结果再动态提供数据迭代。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
约束与限制 - 盘古大模型 PanguLargeModels

模型开发-训练、评测最小数据量要求使用ModelArts Studio平台训练、评测不同模型时，存在不同数据量的限制。以NLP大模型为例，请参考《用户指南》“开发盘古NLP大模型 > 使用数据工程构建NLP大模型数据集”。模型开发-模型最小训练单元不同模型的最小训练单元有所不同，具体信息请参见模型能力与规格。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

通过语种识别模型得到文档的语言类型，筛选所需语种的文档。全局文本去重检测并去除数据中重复或高度相似的文本，防止模型过拟合或泛化性降低。数据打标预训练文本分类针对预训练文本进行内容分类，例如新闻、教育、健康等类别，支持分析语种包括：中文、英文。通用质量评估针对文本进行通用质量的评估，例如流畅度、清晰度、丰富度等。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
数据工程 - 盘古大模型 PanguLargeModels

数据清洗诉求。确保生成高质量的训练数据以满足业务需求和模型训练的要求。用户还可以灵活地调整算子编排顺序以及自定义清洗模板，有效提升数据清洗效率并支持大规模数据处理，确保生成的数据集符合训练的标准。数据合成：平台支持利用预置或自定义的数据指令对预训练文本、单轮问答、单轮问答（人设

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

根据具体问题针对性的提升您的数据质量。比如，随着对话轮数的增加，模型出现了遗忘，可以检查构造的训练数据中轮数是否普遍较少，建议根据实际情况增加数据中的对话轮数。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类算子名称算子描述科学计算

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
如何查看预置模型的历史版本 - 盘古大模型 PanguLargeModels

如何查看预置模型的历史版本 ModelArts Studio平台支持查看预置模型的多个历史版本，并提供对历史版本进行训练等操作的功能。您还可以查看每个版本的操作记录、状态以及其他基础信息。要查看预置模型的历史版本，您可以按照以下步骤操作：进入平台的“空间资产 > 模型 > 预置”页面。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

“默认格式”、“盘古格式”，以满足不同训练任务的需求。通过这些格式的转换，用户可以确保数据与特定模型（如盘古大模型）兼容，并优化训练效果。提高训练效率发布符合标准的数据集可以大幅提升数据处理效率，减少后续调整工作，帮助用户快速进入模型训练阶段。数据集发布是数据工程中的关键环

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
数据工程使用流程 - 盘古大模型 PanguLargeModels

通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。合成数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。标注数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
包年/包月和按需计费模式是否支持互相切换 - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式支持互相切换：盘古大模型提供包周期计费、按需计费两种计费模式，两种计费模式可通过重新订购互相切换。例如，退订训练单元的包周期资源后，可重新订购训练单元的按需计费，即可完成切换。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。表1 视频类清洗算子能力清单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
导入数据过程中，为什么无法选中OBS的具体文件进行上传 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的具体文件进行上传在数据导入过程中，平台仅支持通过OBS服务导入文件夹类型的数据，而不支持直接导入单个文件。您需要将文件整理到文件夹中，并选择该文件夹进行上传。父主题：大模型使用类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
空间管理 - 盘古大模型 PanguLargeModels

、大小、配比比例等，同时平台会自动记录每个数据集的操作历史，例如创建、发布及上线等过程。为了进一步简化管理，平台还支持数据集的删除功能，使用户能够对数据集进行灵活管理和调整。在模型训练和数据分析过程中，用户可以根据需求调用这些数据集，确保数据的准确性与安全性，从而提升数据资产的利

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
如何分析大模型输出错误回答的根因 - 盘古大模型 PanguLargeModels

如何分析大模型输出错误回答的根因大模型的输出过程通常是一个黑盒，涉及数以亿计甚至千亿计的参数计算，虽然这些参数共同作用生成输出，但具体的决策机制并不透明。可以通过在提示词中引导模型输出思考过程，或者在模型输出后追问模型，帮助我们分析错误的根因。例如： “我注意到你犯了xxx的错误，请解释得出该结论的原因。”

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类

总条数： 171

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

流通视频类数据集 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

资源到期了如何续费 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答会异常中断 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

约束与限制 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

如何查看预置模型的历史版本 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式是否支持互相切换 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的具体文件进行上传 - 盘古大模型 PanguLargeModels

空间管理 - 盘古大模型 PanguLargeModels

如何分析大模型输出错误回答的根因 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线