搜索_华为云

知识库介绍 - 盘古大模型 PanguLargeModels

知识库介绍平台提供了知识库功能来管理和存储数据，支持为应用提供自定义数据，并与之进行互动。知识库支持导入以下格式的本地文档：文本文档数据。支持上传常见文本格式，包括：txt、doc、docx、pdf、ppt、pptx格式。表格数据。支持上传常见的表格文件格式，便于管理和分析结构化数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
创建知识库 - 盘古大模型 PanguLargeModels

创建知识库创建知识库的步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。单击左侧导航栏“工作台”，在“知识库”页签，单击右上角“创建知识库”。在“创建知识库”

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
管理知识库 - 盘古大模型 PanguLargeModels

管理知识库 Agent开发平台支持对知识库执行获取知识库ID、删除、命中测试操作。新增、删除知识库中知识文档登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。进入“工作台

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
数据工程 - 盘古大模型 PanguLargeModels

数据工程 ModelArts Studio开发平台提供了全面的数据工程功能。该模块涵盖数据获取、加工、标注、评估和发布等关键环节，帮助用户高效构建高质量的训练数据集，推动AI应用的成功落地。具体功能如下：数据获取：用户可以轻松将多种类型的数据导入ModelArts Studio大模型开发平台

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
创建与管理知识库 - 盘古大模型 PanguLargeModels

创建与管理知识库知识库介绍创建知识库管理知识库父主题：开发盘古大模型Agent应用

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
发布数据集 - 盘古大模型 PanguLargeModels

发布数据集数据集发布场景介绍发布文本类数据集发布图片类数据集发布视频类数据集发布气象类数据集发布预测类数据集发布其他类数据集管理发布后的数据集父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建数据集数据工程介绍数据工程使用流程数据集格式要求导入数据至盘古平台加工数据集发布数据集数据工程常见报错与解决方案

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集科学计算大模型支持接入的数据集类型盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。训练科学计算大模型训练数据要求所需数据量构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
数据工程介绍 - 盘古大模型 PanguLargeModels

数据工程介绍数据工程介绍数据工程是ModelArts Studio大模型开发平台（下文简称“平台”）为用户提供的一站式数据处理与管理功能，旨在通过系统化的数据获取、加工、发布等过程，确保数据能够高效、准确地为大模型的训练提供支持，帮助用户高效管理和处理数据，提升数据质量和处理效率

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
加工数据集 - 盘古大模型 PanguLargeModels

加工数据集数据集加工场景介绍数据集加工算子介绍加工文本类数据集加工图片类数据集加工视频类数据集加工气象类数据集管理加工后的数据集父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据集格式要求 - 盘古大模型 PanguLargeModels

数据集格式要求文本类数据集格式要求图片类数据集格式要求视频类数据集格式要求气象类数据集格式要求预测类数据集格式要求其他类数据集格式要求父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据保护技术 - 盘古大模型 PanguLargeModels

数据保护技术盘古大模型服务通过多种数据保护手段和特性，保障存储在服务中的数据安全可靠。表1 盘古大模型的数据保护手段和特性数据保护手段简要说明传输加密（HTTPS）盘古服务使用HTTPS传输协议保证数据传输的安全性。基于OBS提供的数据保护基于OBS服务对用户的数据进行存储和保护

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
评估视频类数据集 - 盘古大模型 PanguLargeModels

评估视频类数据集发布视频类数据集前，ModelArts Studio大模型开发平台支持对数据集进行评估操作，帮助用户优化数据质量，确保数据满足高标准，提升模型性能。如果无需使用数据评估操作，可跳过此章节至发布视频类数据集。创建视频类数据集评估标准 ModelArts Studio

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 NLP大模型支持接入的数据集类型盘古NLP大模型仅支持接入文本类数据集，数据集文件内容包括：预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等，不同训练方式所需要使用的数据见表1，该数据集格式要求请参见文本类数据集格式要求。表1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
数据工程使用流程 - 盘古大模型 PanguLargeModels

数据工程使用流程高质量数据是推动大模型不断迭代和优化的根基，它的质量直接决定了模型的性能、泛化能力以及应用场景的适配性。只有通过系统化地准备和处理数据，才能提取出有价值的信息，从而更好地支持模型训练。因此，数据的获取、加工、合成、标注、配比、评估、发布等环节，成为数据开发中不可或缺的重要步骤

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
加工视频类数据集 - 盘古大模型 PanguLargeModels

加工视频类数据集加工视频类数据集任务前，请先完成数据导入操作，具体步骤请参见导入数据至盘古平台。创建视频类数据集加工任务登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据加工 > 加工任务”，单击界面右上角

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
管理盘古数据资产 - 盘古大模型 PanguLargeModels

管理盘古数据资产数据资产介绍数据资产是指在平台中被纳入管理、存储并可供使用的数据集。数据资产包含以下两种形式：用户自行发布的数据集。用户可以通过“数据工程 > 数据发布 > 数据流通”功能将数据集发布为数据资产。发布的数据集支持查看详细信息、编辑、删除以及发布至AI Gallery

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

导入数据至盘古平台数据集是一组用于处理和分析的相关数据样本。用户将存储在OBS服务中的数据导入至ModelArts Studio大模型开发平台后，将生成“原始数据集”被平台统一管理，用于后续加工或发布操作。创建导入任务创建导入任务前，请先按照数据集格式要求提前准备数据。平台支持使用

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据预处理优化 - 盘古大模型 PanguLargeModels

数据预处理优化模型训练前，需要对数据进行加工，防止某些特征存在极端异常值或大面积错误数据，导致模型训练不稳定。可能会引发如下问题：模型对异常值过度敏感，导致拟合异常值而非整体数据分布。训练过程中损失波动较大，甚至出现梯度爆炸。模型在测试集上表现不佳，泛化能力差。优化调整策略如下

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
优化训练数据的质量 - 盘古大模型 PanguLargeModels

优化训练数据的质量在数据科学和机器学习领域，数据的质量和多样性对模型的效果至关重要。通过有效的数据预处理和数据优化方法，通过提升训练数据的质量可以显著提升训练所得模型的效果。以下是一些关键的数据优化方法及其具体过程：数据加工错误数据过滤：在大规模数据集中，噪声和错误数据是不可避免的

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践

总条数： 177

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

知识库介绍 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

管理知识库 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

创建与管理知识库 - 盘古大模型 PanguLargeModels

发布数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

加工数据集 - 盘古大模型 PanguLargeModels

数据集格式要求 - 盘古大模型 PanguLargeModels

数据保护技术 - 盘古大模型 PanguLargeModels

评估视频类数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

加工视频类数据集 - 盘古大模型 PanguLargeModels

管理盘古数据资产 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

数据预处理优化 - 盘古大模型 PanguLargeModels

优化训练数据的质量 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线