搜索_华为云

管理加工后的数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据加工 > 加工数据集”。单击数据集名称查看加工数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看加工后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 ModelArts Studio大模型开发平台支持创建视频类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 视频类数据集格式要求文件内容文件格式文件要求视频 mp4或avi 支持mp4、avi视频格式上传，所有视频可以放在多个文件夹

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、审计和数据主权保护等机制。在训练和推理过程中，通过数据脱敏、隐私计算

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
配比图片类数据集 - 盘古大模型 PanguLargeModels

配比图片类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通图片类数据集。创建图片类数据集配比任务创建图片类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
清洗图片类数据集 - 盘古大模型 PanguLargeModels

在完成数据清洗后，如果无需使用数据标注功能，可直接在“数据清洗”页面单击操作列“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：加工图片类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
管理发布后的数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 发布数据集”。单击数据集名称查看发布数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看发布后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
标注图片类数据集 - 盘古大模型 PanguLargeModels

可部分标注”，则可在标注部分数据后，单击右上角的“提交全部标注数据”，让AI大模型自动标注剩余数据。在完成数据标注后，如果无需进行标注审核，可直接在“数据标注 > 任务管理”页面单击“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。审核标注后的图片类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
流通图片类数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“图片 > 图片+Caption”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。由于数据工程需要支持对

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
评估图片类数据集 - 盘古大模型 PanguLargeModels

节至创建图片类数据集评估任务。创建图片类数据集评估标准步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 数据评估”，在“人工评估标准”页签，平台预置了图片类数据集评估标准“图片数据质量标准

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
发布图片类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集评估图片类数据集配比图片类数据集流通图片类数据集父主题：发布数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
加工图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集清洗图片类数据集标注图片类数据集父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
创建提示词评估数据集 - 盘古大模型 PanguLargeModels

上传文件限xlsx格式。数据行数不小于10行，不大于50行。数据不允许相同表头，表头数量小于20个。数据单条文本长度不超过1000。创建数据集时会对相关限制条件进行校验。数据参考格式如下：图1 数据参考格式图2 数据示例创建提示词评估数据集登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案数据工程常见报错及解决方案请详见表1。表1 数据工程常见报错与解决方案功能模块常见报错解决方案数据获取 File format mismatch, require [{0}]. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决在选择是否通过调整提示词或场景微调来解决任务时，需要从以下两个主要方面进行考虑：业务数据的可获取性考虑该任务场景的业务数据是否公开可获取。如果该场景的相关数据可以公开获取，说明模型在训练阶段可能已经接触过类似的语料，因此具有一定的理解能力。这时，通过调整提示词通常可以有效引导模型生成合理的回答。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

可能意味着模型训练状态不正常： Loss曲线上升：Loss上升的原因可能是由于数据质量差，或者学习率设置得过大，使得模型在最优解附近震荡，甚至跳过最优解，导致无法收敛。您可以尝试提升数据质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

文本-单轮问答-jsonl格式上传数据文件后，填写“数据集名称”与“描述”，单击“立即创建”。在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面选择数据集模态并选择数据集文件。单击“下一步”，选择发布格式，填写名称，选择数据集可见性，单击“下一步”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 ModelArts Studio平台支持从OBS服务导入数据。您可以将本地数据上传至OBS（对象存储服务），然后通过平台提供的“数据导入”功能，将存储在OBS中的数据导入至平台进行使用。具体操作步骤如下：上传数据至OBS：将本地数据上传至OBS服务，请详见通过控制台快速使用OBS。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话场景描述此示例演示了如何使用盘古预置NLP大模型进行对话问答，包含两种方式：使用“能力调测”功能和调用API接口。您将学习如何使用“能力调测”功能调试模型超参数、如何调用盘古NLP大模型API以实现智能化对话问答能力。准备工作请确保您有预置的NLP大模型，

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门

总条数： 184

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理加工后的数据集 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

清洗图片类数据集 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

流通图片类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

加工图片类数据集 - 盘古大模型 PanguLargeModels

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线