搜索_华为云

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

如果任务状态为“失败”，可能由以下原因导致：文件后缀校验不通过，需要检查文件后缀是否一致。例如，选择创建csv格式的数据集时，文件后缀应为“.csv”。文件内容校验不通过，需要检查上传的文件数据格式是否正确。可以在“创建原始数据集”页面下载数据样例进行比对。上线原始数据集原始数据集创建成功

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集
数据工程使用流程 - 盘古大模型 PanguLargeModels

平台支持发布的数据集格式为默认格式、盘古格式、自定义格式，可按需进行数据集格式转换。默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要进行数据集格式转换。当前仅文本类、图片类数据集支持转换为盘古格式。自定义格式：文本类数据集可以使用自定义脚本进行数据格式转换。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

文本生成：根据标题、关键词、简介生成段落。若您的无监督文档中含标题、关键词、简介等结构化信息，可以将有监督的问题设置为“请根据标题xxx/关键性xxx/简介xxx，生成一段不少于xx个字的文本。”，将回答设置为符合要求的段落。续写：根据段落的首句、首段续写成完整的段落。若您的无监督文档没有任何结构化信息，可

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据工程 - 盘古大模型 PanguLargeModels

确保数据在进入模型训练前的高质量标准。数据发布：平台支持将处理后的数据集发布为多种格式，包括默认格式和盘古格式。尤其对于文本类和图片类数据集，平台支持将其转换为专门用于训练盘古大模型的盘古格式，为后续模型训练提供高效的数据支持。通过整合上述功能，数据工程模块不仅帮助用户高效构

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

您可以通过以下方式使用该功能：在左侧导航栏选择“能力调测”，单击右下角“Token计算器”使用该功能。使用API调用Token计算器，详见《API参考》“API > Token计算器”。 NLP大模型训练类型选择建议平台针对NLP大模型提供了两种训练类型，包括预训练和微调，二者区别详见表3。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

件内容格式是否一致。 Verification failed. Please check the content format is consistent with the template requirements. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

正负向要求不要掺杂着写，可以先全部列完正向要求，再列负向要求，比如“你必须xxx；你必须xxx；你不能xxx；你不能xxx”。规范输出格式如果需要约束输出格式，可以在提示词里体现。请注意输出格式中的key不要有语义重复，并且需要与前文要求中的key名字保持一致，否则模型会不理解是同一个key。恰当的表述

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
责任共担 - 盘古大模型 PanguLargeModels

aS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云安全性的构建思路与措

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
设置背景及人设 - 盘古大模型 PanguLargeModels

信息、行业前沿热点等...生成...”，或者可以说明已有的信息是什么领域的信息，比如“以上是金融领域的新闻”、“以上是一篇xx领域的xxx文档”。例如，“结合金融领域相关知识，生成一份调研报告大纲，报告主题是区块链洞察”、“以上是某理财app用户反馈的问题，请提供解决方案。” 人设：

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化json数据。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
什么是提示词工程 - 盘古大模型 PanguLargeModels

上下文：包含外部信息或额外的上下文信息，引导语言模型更好地响应。输入数据：用户输入的内容或问题。输出指示：指定输出的类型或格式。提示词所需的格式取决于您希望语言模型完成的任务类型，并非所有以上要素都是必须的。提示词工程使用流程 ModelArts Studio大模型开发

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程
创建工作流 - 盘古大模型 PanguLargeModels

输出参数的类型，当前可选类型只有String。描述对于该输出参数的描述。如下场景时，可以通过配置输出参数来解析大模型组件的输出：当大模型组件的输出为json格式的数据时，可以通过配置输出参数来解析出json中对应字段的值。例如大模型组件的输出为json数据'{"result": "test"}'时

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理工作流
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

宣传文案样例2： YYYY 注意：宣传文案中需要包含产品名称；需要突出产品特性；不超过40个字。输出格式：宣传文案：xxx 微调数据要求：数据格式样例：JSONL格式，每行是一条JSON，包含“context”和“target”两个字段。示例如下： {"context":

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

图6 创建用户配置用户基本信息，单击“下一步”。配置用户信息时，需要勾选“编程访问”，如果未勾选此项，会导致IAM用户无法使用盘古服务API、SDK。图7 配置用户基本信息将用户添加至创建用户组步骤中创建的用户组，单击“创建用户”，完成IAM用户的创建。图8 加入用户组添加盘古子用户至工作空间

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作 > 创建并管理盘古工作空间
权限管理 - 盘古大模型 PanguLargeModels

通过IAM，您可以在华为云账号中给员工创建IAM用户（子用户），并授权控制他们对华为云资源的访问范围。例如，您的员工中有负责软件开发的人员，您希望他们拥有接口的调用权限，但是不希望他们拥有训练模型或者访问训练数据的权限，那么您可以先创建一个IAM用户，并设置该用户在盘古平台中的角色，控制对资源的使用范围。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
什么是盘古大模型 - 盘古大模型 PanguLargeModels

数据是大模型训练的基础，为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分，具备数据获取、清洗、配比和管理等功能。该工具链能够高效收集和处理各种格式的数据，满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能力，对原始数据进行优化，确保其质量和一致性。同时，数据工程工具链

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

去除重复数据：确保数据集中每条数据的唯一性。填补缺失值：填充数据中的缺失部分，常用方法包括均值填充、中位数填充或删除缺失数据。数据标准化：将数据转换为统一的格式或范围，特别是在处理数值型数据时（如归一化或标准化）。去噪处理：去除无关或异常值，减少对模型训练的干扰。数据预处理的目的是保证数据集的

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
功能总览 - 盘古大模型 PanguLargeModels

数据是大模型训练的基础，为大模型提供了必要的知识和信息。数据工程工具链作为盘古大模型服务的重要组成部分，具备数据获取、清洗、配比和管理等功能。该工具链能够高效收集和处理各种格式的数据，满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能力，对原始数据进行优化，确保其质量和一致性。同时，数据工程工具链

 帮助中心 > 盘古大模型 PanguLargeModels > 功能总览
空间管理 - 盘古大模型 PanguLargeModels

性与安全性。数据资产：数据资产是指用户在平台上发布的所有数据集。这些数据集会被存储在数据资产中，用户可以随时查看数据集的详细信息，如数据格式、大小、配比比例等，同时平台会自动记录每个数据集的操作历史，例如创建、发布及上线等过程。为了进一步简化管理，平台还支持数据集的删除功能，使

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据集评估场景介绍 - 盘古大模型 PanguLargeModels

NLP数据质量标准 V1.0：ModelArts Studio大模型开发平台针对文本数据集预设了一套基础评估标准，涵盖了数据准确性、完整性、一致性、格式规范等多个维度。该标准旨在帮助用户高效评估和优化文本数据的质量，确保数据符合模型训练的要求，提升模型的性能和可靠性。用户可以直接使用该标准

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 评估数据集

总条数： 140

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

数据工程使用流程 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

责任共担 - 盘古大模型 PanguLargeModels

设置背景及人设 - 盘古大模型 PanguLargeModels

气象类加工算子能力清单 - 盘古大模型 PanguLargeModels

什么是提示词工程 - 盘古大模型 PanguLargeModels

创建工作流 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

权限管理 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

功能总览 - 盘古大模型 PanguLargeModels

空间管理 - 盘古大模型 PanguLargeModels

数据集评估场景介绍 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线