搜索_华为云

Token计算器 - 盘古大模型 PanguLargeModels

Boolean 是否仅统计输入字符的Token数 true：仅统计输入字符串的Token数； false：统计输入字符串和推理过程产生字符的总Token数。响应参数表4 响应Body参数参数参数类型描述 tokens List<String> 分解出的Token列表。 token_number

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API
清洗图片类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据加工 > 数据清洗”，单击界面右上角“创建清洗任务”。在“创建清洗任务”页面，选择需要清洗的图片类数据集，单击“下一步”。进入“清洗步骤编排”页面。对于图片类数据集，可选择的清洗算子请参见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
标注文本类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据加工 > 数据标注”，单击页面右上角“创建标注任务”。在“创建标注任务”页面选择需要标注的文本类数据集，并选择标注项。选择标注项时，不同类型的数据文件对应的标注项有所差异，可基于页面提示进行选择。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
清洗视频类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据加工 > 数据清洗”，单击界面右上角“创建清洗任务”。在“创建清洗任务”页面，选择需要清洗的视频类数据集，单击“下一步”。进入“清洗步骤编排”页面。对于视频类数据集，可选择的清洗算子请参见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
标注视频类数据集 - 盘古大模型 PanguLargeModels

直到达到所需的标注粒度。如图2，首先标注视频中的“大类别”（如“动物”），然后根据该大类别进一步细分为多个子类。这种方式可以更精细地表示视频中涉及的不同对象或情境。图2 多层级分类示例-声音分类文本描述：如图3，文本描述允许标注者以文字的形式为视频片段提供更详细的说明或描述。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

为无标签数据集添加准确的标签，确保模型训练所需的高质量数据。平台支持人工标注和AI预标注两种方式，用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。标注图片类数据集、标注视频类数据集发布图片、视频类数据集评估图片、视频类数据集平台预置了多种数据类型的基础评估

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
标注图片类数据集 - 盘古大模型 PanguLargeModels

选择标注项为“图片Caption”且开启AI预标注功能时，可设置以下两种方式的“标注要求”：选择“全部标注”：要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。选择“可部分标注”：允许标注人员在确认AI预标注满足要求后，直接使用AI预标注功能完成数据集的标注并提交标注结果。标注审核是否审核否，标注后不进行审核操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
调用工作流 - 盘古大模型 PanguLargeModels

描述 data String stream=true时，执行工作流的消息以流式形式返回。生成的内容以增量的方式逐步发送回来，每个data字段均包含一部分生成的内容，直到所有data返回，响应结束。表6 流式输出的数据单元参数参数类型描述 event String 数据单元类型，有以下几种类型：

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > Agent
使用盘古NLP大模型创建Python编码助手应用 - 盘古大模型 PanguLargeModels

t开发平台预置的Python解释器预置插件。 “Python解释器插件”能够执行用户输入的Python代码，并获取结果。此插件为应用提供了强大的计算、数据处理和分析功能，用户只需将其添加到应用中，即可扩展功能。准备工作请确保您有预置的NLP大模型，并已完成模型的部署操作，详见《用户指南》“开发盘古NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。人工评测：您可以采用人工评测的方式，参照目标任务构造评测集，通过横向或纵向评估评测集的方式来验证模型效果。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

间差距的指标。该值越小，表示模型在表面（海表）变量的预测精度越高。 RMSE 均方根误差，衡量预测值与真实值之间差距的指标。它是所有单个观测的平方误差的平均值的平方根。该值越小，代表模型性能越好。 MAE 平均绝对误差，衡量预测值与真实值之间差距的指标。它是所有单个观测的绝对误差的平均值。该值越小，代表模型性能越好。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建提示词评估数据集 - 盘古大模型 PanguLargeModels

批量评估提示词效果前，需要先上传提示词变量数据文件用于创建对应的评估数据集。提示词变量是一种可以在文本生成中动态替换的占位符，用于根据不同的场景或用户输入生成不同的内容。其中，变量名称可以是任意的文字，用于描述变量的含义或作用。提示词评估数据集约束限制上传文件限xlsx格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

让模拟出的天气接近真实世界中的变化。 CNOP噪音通过在初始场中引入特定的扰动来研究天气系统的可预报性，会对扰动本身做一定的评判，能够挑选出预报结果与真实情况偏差最大的一类初始扰动。这些扰动不仅可以用来识别最可能导致特定天气或气候事件的初始条件，还可以用来评估预报结果的不确定性。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型
创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据获取”，单击界面右上角“创建导入任务”。在“创建导入任务”页面选择所需要的“文件内容”、“文件格式”、“导入来源”，并单击“选择路径”上传数据文件。 NLP大模型评测数据集支持的格式见表1。表1 评测数据集格式模型类型评测数据集格式 NLP大模型文本-单轮问答-jsonl格式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母，文本长度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作，不支持数据加工操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中一个参数的值，可以提升模型回答的确定性，避免生成异常内容。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

合成文本类数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。合成文本类数据集标注文本类数据集为无标签数据集添加准确的标签，确保模型训练所需的高质量数据。平台支持人工标注和AI预标注两种方式，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
创建插件 - 盘古大模型 PanguLargeModels

高。 API Key鉴权：通过唯一的API Key来认证应用之间的访问权限，可以使用Header鉴权或Query鉴权的方式，需要提供密钥鉴权参数名和密钥值，安全性较低。请求头插件服务的请求头。添加请求的数据格式等说明，敏感信息请通过权限校验的方式实现。自定义插件使用HTTP

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

微调阶段：微调阶段通过在特定领域的数据集上进一步训练，使模型能够更有效地应对具体的任务需求。在微调过程中，通过设定训练指标来监控模型的表现，确保其达到预期的效果。完成微调后，将对用户模型进行评估并进行最终优化，以确保满足业务需求，然后将其部署和调用，用于实际应用。 CV大模型选择建议选择合适的CV大模

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型

总条数： 195

上一页
1
...
4
5
6
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Token计算器 - 盘古大模型 PanguLargeModels

清洗图片类数据集 - 盘古大模型 PanguLargeModels

标注文本类数据集 - 盘古大模型 PanguLargeModels

清洗视频类数据集 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

调用工作流 - 盘古大模型 PanguLargeModels

使用盘古NLP大模型创建Python编码助手应用 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

查看科学计算大模型训练状态与指标 - 盘古大模型 PanguLargeModels

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

CV大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线