搜索_华为云

评测NLP大模型 - 盘古大模型 PanguLargeModels

评测NLP大模型创建NLP大模型评测数据集创建NLP大模型评测任务查看NLP大模型评测报告管理NLP大模型评测任务父主题：开发盘古NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
管理NLP大模型评测任务 - 盘古大模型 PanguLargeModels

管理NLP大模型评测任务管理评测任务在评测任务列表中，任务创建者可以对任务进行克隆（复制评测任务）、启动（重启评测任务）和删除操作。登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

单击操作列“评测报告”，在“评测报告”页面，可以查看评测任务的基本信息及评测概览。其中，各评测指标说明详见NLP大模型评测指标说明。导出评测报告。在“评测报告 > 评测明细”页面，单击“导出”，可选择需要导出的评测报告，单击“确定”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

评测配置评测类型选择“自动评测”。评测规则选择“基于规则”。评测数据集评测模板：使用预置的专业数据集进行评测。单个评测集：由用户指定评测指标（F1分数、准去率、BLEU、Rouge）并上传评测数据集进行评测。选择“单个评测集”时需要上传待评测数据集。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

创建NLP大模型评测数据集 NLP大模型支持人工评测与自动评测，在执行模型评测任务前，需创建评测数据集。评测数据集的创建步骤与训练数据集一致，本章节仅做简单介绍，详细步骤请参见使用数据工程构建NLP大模型数据集。登录ModelArts Studio平台，进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

人工评测：您可以采用人工评测的方式，参照目标任务构造评测集，通过横向或纵向评估评测集的方式来验证模型效果。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
盘古预测大模型能力与规格 - 盘古大模型 PanguLargeModels

不同模型在预训练、微调、模型评测、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

待评测数据不存在，请检查数据是否导入成功，OBS桶是否为空。 obs url invalid. 请检查数据集对应的OBS路径是否有效，是否可正常访问。 standard item not exist. 请检查评估标准是否存在，是否被删除。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

模型开发工具链：模型开发工具链是盘古大模型服务的核心组件，提供从模型创建到部署的一站式解决方案，涵盖模型训练、压缩、部署、评测、调用等功能，保障模型的高效应用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
什么是盘古大模型 - 盘古大模型 PanguLargeModels

该工具链具备模型训练、压缩、部署、评测、推理等功能，通过高效的推理性能和跨平台迁移工具，模型开发工具链能够保障模型在不同环境中的高效应用。 Agent开发工具链应用开发工具链是盘古大模型平台的关键模块，支持提示词工程和智能Agent应用创建。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

不同模型在预训练、微调、模型评测、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
开发盘古NLP大模型 - 盘古大模型 PanguLargeModels

开发盘古NLP大模型使用数据工程构建NLP大模型数据集训练NLP大模型压缩NLP大模型部署NLP大模型评测NLP大模型调用NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
成长地图 - 盘古大模型 PanguLargeModels

盘古大模型能力通过ModelArts Studio大模型开发平台承载，它提供了包括盘古大模型在内的多种大模型服务，提供覆盖全生命周期的大模型工具链。

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
功能总览 - 盘古大模型 PanguLargeModels

该工具链具备模型训练、压缩、部署、评测、推理等功能，通过高效的推理性能和跨平台迁移工具，模型开发工具链能够保障模型在不同环境中的高效应用。

帮助中心 > 盘古大模型 PanguLargeModels > 功能总览
模型开发 - 盘古大模型 PanguLargeModels

模型评测：为了确保模型的实际应用效果，平台提供了多维度的模型评测功能。通过自动化的评测机制，用户可以在训练过程中持续监控模型的精度、召回率等关键指标，及时发现潜在问题并优化调整。评测功能能够帮助用户在多种应用场景下验证模型的准确性与可靠性。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

不同模型在预训练、微调、模型评测、模型压缩、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
产品优势 - 盘古大模型 PanguLargeModels

产品优势预置多，数据工程“易” ModelArts Studio大模型开发平台预置多种数据处理AI算子，多种标注工具，满足用户多任务多场景需求，提高开发/标注效率>10X。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

不同模型在预训练、微调、模型评测、在线推理和能力调测等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
撰写提示词 - 盘古大模型 PanguLargeModels

在评估提示词效果时，可以通过批量替换{{location}}的值，来获得模型回答，提升评测效率。同时，撰写提示词过程中，可以通过设置模型参数来控制模型的生成行为，如调整温度、核采样、最大Token限制等参数。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 撰写提示词
约束与限制 - 盘古大模型 PanguLargeModels

模型开发-训练、评测最小数据量要求使用ModelArts Studio平台训练、评测不同模型时，存在不同数据量的限制。以NLP大模型为例，请参考《用户指南》“开发盘古NLP大模型 > 使用数据工程构建NLP大模型数据集”。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍

总条数： 34

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

评测NLP大模型 - 盘古大模型 PanguLargeModels

管理NLP大模型评测任务 - 盘古大模型 PanguLargeModels

查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

盘古预测大模型能力与规格 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

盘古CV大模型能力与规格 - 盘古大模型 PanguLargeModels

开发盘古NLP大模型 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

功能总览 - 盘古大模型 PanguLargeModels

模型开发 - 盘古大模型 PanguLargeModels

盘古科学计算大模型能力与规格 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

撰写提示词 - 盘古大模型 PanguLargeModels

约束与限制 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线