搜索_华为云

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

训练预测大模型时，所需的数据通常为表格格式，即由行和列组成的扁平化数据。具体要求如下：行：每行代表一个样本。每行与其他行具有相同的列，并且顺序相同，这些行通常按照某种特定顺序排列。列：每列表示一种特征。每列的数据类型应保持一致，不同列可以具有不同的数据类型。顺序：表格中的行通常按照特定顺序排列。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

学习。这里提供了一些将无监督数据转换为有监督数据的方案，供您参考：基于规则构建：您可以通过采用一些简单的规则来构建有监督数据。比如：表1 采用规则将无监督数据构建为有监督数据的常用方法规则场景说明文本生成：根据标题、关键词、简介生成段落。若您的无监督文档中含标题、关

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

集文件内容包括：预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等，不同训练方式所需要使用的数据见表1，该数据集格式要求请参见文本类数据集格式要求。表1 训练NLP大模型数据集类型要求基模型训练场景数据集类型数据集内容文件格式 NLP 预训练文本预训练文本

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案数据工程常见报错及解决方案请详见表1。表1 数据工程常见报错与解决方案功能模块常见报错解决方案数据获取 File format mismatch, require [{0}]. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
编排应用 - 盘古大模型 PanguLargeModels

Agent平台支持为应用配置插件、工作流技能，支持接入知识库，还可增加应用的对话体验，详见创建与管理插件、编排工作流、创建与管理知识库。应用编排流程见表1。表1 应用编排流程操作步骤说明步骤1：创建应用创建一个新应用。步骤2：配置Prompt 在应用中配置大模型所需的Prompt。步骤3：添加插件

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
创建推理作业 - 盘古大模型 PanguLargeModels

abc”。可选择的要素参考表8中，提供的高空变量和表面变量。 num_ensembles 否 Long 集合数量。在气象预报中，集合预报是指对初始场加入一定程序的扰动，使其生成一组由不同初始场预报的天气预报结果，从而提供对未来天气状态的概率信息。这种方法可以更好地表达预报的不确定性，从而提高预报的准确性和可靠性。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 气象/降水模型
训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、案

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

//视频文件扩展名。 // 标注 34.5, 42.4 分别表示起始时间和结束时间，单位为s。 // label 表示分类，必须是classes列表中的一个元素，表示该视频片段对应的事件或动作类型。 'annotations':

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决在选择是否通过调整提示词或场景微调来解决任务时，需要从以下两个主要方面进行考虑：业务数据的可获取性考虑该任务场景的业务数据是否公开可获取。如果该场景的相关数据可以公开获取，说明模型在训练阶段可能已经接触过类似的语料，因此具有一

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

取、数据转换、数据过滤三类，文本类加工算子能力清单见表1。表1 文本类清洗算子能力清单算子分类算子名称算子描述数据提取 WORD内容提取从Word文档中提取文字，并保留原文档的目录、标题和正文等结构，不保留图片、表格、公式、页眉、页脚。 TXT内容提取从TXT文件中提取所有文本内容。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
创建提示词评估数据集 - 盘古大模型 PanguLargeModels

字，用于描述变量的含义或作用。提示词评估数据集约束限制上传文件限xlsx格式。数据行数不小于10行，不大于50行。数据不允许相同表头，表头数量小于20个。数据单条文本长度不超过1000。创建数据集时会对相关限制条件进行校验。数据参考格式如下：图1 数据参考格式图2

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

org/project/rouge-score/）进行问答对的过滤。下表列举了该场景常见的数据质量问题，以及相对应的清洗策略，供您参考：表1 微调数据问题与清洗策略序号数据问题清洗步骤与方式 1 问题或回答中带有不需要的特定格式内容或者时间戳等。通过编写代码、正则表达式等进行处理，删除或者修改对应的内容，或者直接过滤掉整条数据。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。表1 视频类清洗算子能力清单算子分类算子名称算子描述数据提取镜头拆分根据视频中的镜头场景变化将长视频拆分为短视频片段，如果某个

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类算子名称算子描述数据提取图文提取提取图文压缩包中的JSON文本和图片，并对图片进行结构化解析（BASE64编码）。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

模的要求，还涵盖了数据质量、平衡性和代表性的保证，避免数据不均衡或不具备足够多样性的情况，进而提高模型的准确性和鲁棒性。提高数据的多样性和代表性通过合理的数据配比，帮助用户按特定比例组合多个数据集，确保数据集在不同任务场景下的多样性和代表性。这样可以避免过度偏向某一类数据，保

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

与时序数据不同，回归分类数据不要求数据具有时间顺序。具体格式要求详见表1。表1 预测类数据集格式要求文件内容文件格式文件样例时序 csv 数据为结构化数据，包含列和行，每一行表示一条数据，每一列表示一个特征，并且必须包含预测目标列，预测目标列要求为连续型数据。目录下只有1个数据文件时，文件无命名要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
管理加工后的数据集 - 盘古大模型 PanguLargeModels

管理加工后的数据集完成数据清洗、数据合成、或数据标注任务的数据集，在对应任务列表执行“生成”操作，将生成“加工数据集”被平台统一管理，并用于后续的发布任务。平台支持对加工数据集查看基本信息、数据血缘等管理操作，具体步骤如下：登录ModelArts Studio大模型开发平台

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集

总条数： 110

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

编排应用 - 盘古大模型 PanguLargeModels

创建推理作业 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

如何判断任务场景应通过调整提示词还是场景微调解决 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

管理加工后的数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线