搜索_华为云

数据工程介绍 - 盘古大模型 PanguLargeModels

处理与管理功能，旨在通过系统化的数据获取、加工、发布等过程，确保数据能够高效、准确地为大模型的训练提供支持，帮助用户高效管理和处理数据，提升数据质量和处理效率，为大模型开发提供坚实的数据基础。数据工程包含的具体功能如下：数据获取：数据获取是数据工程的第一步，支持将不同来源和格式的数据导入平台。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
创建并管理盘古工作空间 - 盘古大模型 PanguLargeModels

填写空间名称、描述，单击“确认”，完成空间的创建。图1 创建空间单击创建好的空间，进入ModelArts Studio大模型开发平台。如果用户具备多个空间的访问权限，可在页面左上角单击切换空间。图2 切换空间管理盘古工作空间盘古工作空间支持用户查看当前空间详情，修改空间名称与描述，还可以对不需要的空间实现删除操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作 > 创建并管理盘古工作空间
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

解决在选择是否通过调整提示词或场景微调来解决任务时，需要从以下两个主要方面进行考虑：业务数据的可获取性考虑该任务场景的业务数据是否公开可获取。如果该场景的相关数据可以公开获取，说明模型在训练阶段可能已经接触过类似的语料，因此具有一定的理解能力。这时，通过调整提示词通常可以有效引导模型生成合理的回答。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
清洗气象类数据集 - 盘古大模型 PanguLargeModels

数据清洗”，单击界面右上角“创建清洗任务”。在“创建清洗任务”页面，选择需要清洗的气象类数据集，单击“下一步”。进入“清洗步骤编排”页面。对于气象类数据集，可选择的清洗算子请参见表1。在左侧“添加算子”分页勾选所需算子。在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工气象类数据集
发布气象类数据集 - 盘古大模型 PanguLargeModels

模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“气象 > 气象数据”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前气象类数据集仅支持发布默认格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

参数填写完成后，单击“立即创建”，回退至“模型评测 > 人工评测”页面。当状态为“待评测”时，可以单击操作列“在线评测”进入评测页面。依据页面提示对评估效果区域进行评测打分，全部数据评测完成后单击“提交”。图1 人工评测示例在“人工测评”页面，评测任务的状态将显示为“已完成”，单击操作列“评测报告”查看模型评测结果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
发布训练后的CV大模型 - 盘古大模型 PanguLargeModels

间。在左侧导航栏中选择“模型开发 > 模型训练”，单击模型名称进入任务详情页。单击进入“训练结果”页签，单击“发布”。图1 训练结果页面填写资产名称、描述，选择对应的可见性，单击“确定”发布模型。发布后的模型会作为模型资产同步显示在“空间资产 > 模型”列表中。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
发布训练后的预测大模型 - 盘古大模型 PanguLargeModels

间。在左侧导航栏中选择“模型开发 > 模型训练”，单击模型名称进入任务详情页。单击进入“训练结果”页签，单击“发布”。图1 训练结果页面填写资产名称、描述，选择对应的可见性，单击“确定”发布模型。发布后的模型会作为模型资产同步显示在“空间资产 > 模型”列表中。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
构造请求 - 盘古大模型 PanguLargeModels

Endpoint 承载REST服务端点的服务器域名或IP。 resource-path 资源路径，即API访问路径。从具体API的URI模块获取。 query-string 查询参数，可选，查询参数前面需要带一个“？”，形式为“参数名=参数取值”。获取请求URI的步骤详见请求URI，示例如下：

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
清洗视频类数据集 - 盘古大模型 PanguLargeModels

数据清洗”，单击界面右上角“创建清洗任务”。在“创建清洗任务”页面，选择需要清洗的视频类数据集，单击“下一步”。进入“清洗步骤编排”页面。对于视频类数据集，可选择的清洗算子请参见表1。在左侧“添加算子”分页勾选所需算子。在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
发布其他类数据集 - 盘古大模型 PanguLargeModels

模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“其他 > 自定义”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前其他类数据集仅支持发布默认格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
压缩NLP大模型 - 盘古大模型 PanguLargeModels

模型压缩”，单击界面右上角“创建压缩任务”。在“创建压缩任务”页面，选择需要压缩的基础模型，支持选择已发布模型或未发布模型。选择压缩策略。除INT8压缩策略外，部分模型支持INT4压缩策略，可在选择模型后，根据页面展示的策略进行选择。 INT8：该压缩策略将模型参数压缩至8位字节，可以有效降低推理显存占用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
发布训练后的科学计算大模型 - 盘古大模型 PanguLargeModels

间。在左侧导航栏中选择“模型开发 > 模型训练”，单击模型名称进入任务详情页。单击进入“训练结果”页签，单击“发布”。图1 训练结果页面填写资产名称、描述，选择对应的可见性，单击“确定”发布模型。发布后的模型会作为模型资产同步显示在“空间资产 > 模型”列表中。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
管理科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

删除操作。登录ModelArts Studio大模型开发平台，进入所需空间。在左侧导航栏中选择“模型开发 > 模型训练”，进入模型训练页面，可进行如下操作：编辑。单击操作列的“编辑”，可以修改模型的checkpoints、训练参数、训练数据以及基本信息等。启动。单击操作列

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“模型开发 > 模型评测”。单击操作列“评测报告”，在“评测报告”页面，可以查看评测任务的基本信息及评测概览。其中，各评测指标说明详见NLP大模型评测指标说明。导出评测报告。在“评测报告 > 评测明细”页面，单击“导出”，可选择需要导出的评测报告，单击“确定”。单击右侧“

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
清洗文本类数据集 - 盘古大模型 PanguLargeModels

数据清洗”，单击界面右上角“创建清洗任务”。在“创建清洗任务”页面，选择需要清洗的文本类数据集，单击“下一步”。进入“清洗步骤编排”页面。对于文本类数据集，可选择的清洗算子请参见文本类清洗算子能力清单。在左侧“添加算子”分页勾选所需算子。在右侧“清洗步骤编排”页面配置各算子参数，可拖动右侧“”以调整算子执行顺序。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
发布预测类数据集 - 盘古大模型 PanguLargeModels

模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 数据流通”，单击界面右上角“创建流通任务”。在“创建流通任务”页面，选择数据集模态，如“预测 > 时序”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前预测类数据集仅支持发布默认格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

关。 RQE 衡量预测值与真实值之间差距的指标。它是所有单个观测的相对误差的平方和。该值越小，代表模型性能越好。获取训练日志单击训练任务名称，可以在“日志”页面查看训练过程中产生的日志。对于训练异常或失败的任务也可以通过训练日志定位训练失败的原因。典型训练报错和解决方案请参见科学计算大模型训练常见报错与解决方案。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建插件 - 盘古大模型 PanguLargeModels

开发平台。单击左侧导航栏“工作台”，在“插件”页签，单击右上角“创建插件”。在“创建插件”页面，填写插件名称与插件描述，单击图片可上传插件图标，单击“下一步”。在“配置信息”页面，参照表1完成信息配置。表1 插件信息配置说明参数名称参数说明插件URL 插件服务的请求URL地址。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
创建知识库 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。进入“工作台 > 知识库”页面，单击所需知识库，进入知识库基本信息页面，单击右上角“命中测试”。在文本框中输入问题，单击“命中测试”，页面下方将展示多条匹配的内容，并按照匹配分值降序排列。用户可以根据分值与匹配到的信息数量来评估当前知识库是否满足需求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库

总条数： 121

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据工程介绍 - 盘古大模型 PanguLargeModels

创建并管理盘古工作空间 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

清洗气象类数据集 - 盘古大模型 PanguLargeModels

发布气象类数据集 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

发布训练后的CV大模型 - 盘古大模型 PanguLargeModels

发布训练后的预测大模型 - 盘古大模型 PanguLargeModels

构造请求 - 盘古大模型 PanguLargeModels

清洗视频类数据集 - 盘古大模型 PanguLargeModels

发布其他类数据集 - 盘古大模型 PanguLargeModels

压缩NLP大模型 - 盘古大模型 PanguLargeModels

发布训练后的科学计算大模型 - 盘古大模型 PanguLargeModels

管理科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

清洗文本类数据集 - 盘古大模型 PanguLargeModels

发布预测类数据集 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线