搜索_华为云

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

数据集加工场景介绍数据加工概念数据加工是数据工程中的核心环节，旨在通过使用数据集加工算子对原始数据进行清洗、转换、提取和过滤等操作，以确保数据符合模型训练的标准和业务需求。通过这一过程，用户能够优化数据质量，去除噪声和冗余信息，提升数据的准确性和一致性，为后续的模型训练提供

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

能引发的问题，从而构建高质量、适应性强的数据集，为后续的模型训练、验证和应用提供坚实的数据支持。数据发布意义数据发布不仅包括数据的格式转换，还涉及数据比例的调整，以确保数据在规模、质量和内容上满足训练标准。具体而言，数据集发布具有以下重要意义：数据比例和结构调整：平台提供灵

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
发布文本类数据集 - 盘古大模型 PanguLargeModels

默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要将数据集格式发布为“盘古格式”。自定义格式：文本类数据集可以使用自定义脚本进行数据格式转换。发布文本类数据集操作步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要将数据集格式发布为“盘古格式”。自定义格式：文本类数据集可以使用自定义脚本进行数据格式转换。发布图片类数据集操作步骤如下：登录ModelArts Studio大模型开发平台，进入所需操作空间。图1 进入操作空间在左侧导航栏中选择“数据工程

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
使用API调用NLP大模型 - 盘古大模型 PanguLargeModels

用的NLP大模型，单击“调用路径”，在“调用路径”弹窗获取调用路径。图3 获取预置服务调用路径获取Token。参考《API参考》文档“如何调用REST API > 认证鉴权”章节获取Token。在Postman中新建POST请求，并填入API请求地址。参考图4填写2个请求Header参数。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 调用NLP大模型
使用API调用科学计算大模型 - 盘古大模型 PanguLargeModels

的科学计算大模型，单击“调用路径”，在“调用路径”弹窗获取调用路径。图2 获取预置服务调用路径获取Token。参考《API参考》文档“如何调用REST API > 认证鉴权”章节获取Token。在Postman中新建POST请求，并填入步骤2的API请求地址。参考图3填写2个请求Header参数。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型
手工编排Agent应用流程 - 盘古大模型 PanguLargeModels

您也可以鼠标单击已有应用右上角的，进行应用的复制、删除、复制ID操作。在“创建应用”窗口中，填写应用名称与应用描述，单击左下角的图片可更换应用图标，单击“确定”，进入应用详情页面。图1 填写应用名称与应用描述图2 创建应用配置Prompt builder，详见配置Prompt

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 手工编排Agent应用
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

选择合适的模型，从而提高模型的整体效果，详见表1。此外，不同类型的NLP大模型在训练过程中，读取中文、英文内容时，字符长度转换为Token长度的转换比有所不同，详见表2。表1 不同系列NLP大模型对处理文本的长度差异模型支持区域模型名称可处理最大Token长度说明西南-贵阳一

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
状态码 - 盘古大模型 PanguLargeModels

这个临时响应用来通知客户端，它的部分请求已经被服务器接收，且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。例如，切换到HTTPS的新版本协议。 200 OK 服务器已成功处理了请求。 201 Created 创建类的请求完全成功。 202

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

训练任务。平台支持发布的数据集格式为默认格式、盘古格式，可按需进行数据集格式转换。默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要进行数据集格式转换。当前仅文本类、图片类数据集支持转换为盘古格式。 NLP大模型开发流程 ModelArts Studio大模型开发平

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
管理盘古数据资产 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，进入所需空间。在左侧导航栏“空间资产 > 数据”中可以查看当前空间内的数据资产，如果有多个空间的访问权限，可切换空间查看其他空间内的资产。在“数据发布”页签可查看数据资产，并可对数据集进行删除操作。单击数据集名称可进入详情页面查看数据集的基础信息和操作概览。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

使输出结果更加多样化。最大口令限制用于控制聊天回复的长度和质量。话题重复度控制用于控制生成文本中的重复程度。调高参数模型会更频繁地切换话题，从而避免生成重复内容。词汇重复度控制用于调整模型对频繁出现的词汇的处理方式。调高参数会使模型减少相同词汇的重复使用，促使模型使用更多样化的词汇进行表达。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 调用NLP大模型
数据工程 - 盘古大模型 PanguLargeModels

训练前的高质量标准。数据发布：平台支持将处理后的数据集发布为多种格式，包括默认格式和盘古格式。尤其对于文本类和图片类数据集，平台支持将其转换为专门用于训练盘古大模型的盘古格式，为后续模型训练提供高效的数据支持。通过整合上述功能，数据工程模块不仅帮助用户高效构建高质量的训练数据

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程介绍 - 盘古大模型 PanguLargeModels

数据加工：数据加工是确保数据质量的关键步骤。平台提供一系列数据清洗、过滤、转换等加工操作，旨在确保原始数据能够满足各种业务需求和模型训练的标准。针对不同类型的数据集，平台设计了专用的加工算子（即为特定数据处理任务预定义的操作模块，如文本去重、格式转换、异常处理等），通过这些算子能够高效地处理各类数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

去除重复数据：确保数据集中每条数据的唯一性。填补缺失值：填充数据中的缺失部分，常用方法包括均值填充、中位数填充或删除缺失数据。数据标准化：将数据转换为统一的格式或范围，特别是在处理数值型数据时（如归一化或标准化）。去噪处理：去除无关或异常值，减少对模型训练的干扰。数据预处理的目的是

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
管理盘古模型资产 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，进入所需空间。在左侧导航栏“空间资产 > 模型”中可以查看当前空间和预置的模型资产，如果有多个空间的访问权限，可切换空间查看其他空间内的资产。在“本空间”页签可查看模型资产，并可对模型进行删除操作。单击模型名称可进入详情页面查看模型的基础信息。在“预

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
大模型开发基本概念 - 盘古大模型 PanguLargeModels

大模型的计量单位token指的是什么令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个to

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
创建工作流 - 盘古大模型 PanguLargeModels

IF分支其他操作如下：单击“添加条件”，在当前分支添加多个条件表达式，多个条件表达式之间通过“and”或“or”来连接。单击“and”或者“or”，可以切换该分支表达式的运算逻辑。图8 IF 分支配置图 “添加分支”可以添加新的分支ELSE IF，新分支的配置方式与IF分支相同。图9 添加ELSE

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理工作流
管理NLP大模型部署任务 - 盘古大模型 PanguLargeModels

管理NLP大模型部署任务模型更新、修改部署成功创建部署任务后，如需修改已部署的模型或配置信息，可以在详情页面单击右上角的“模型更新”或“修改部署”进行调整。更新模型时可以替换模型，但在修改部署时模型不可替换。在“模型更新”或“修改部署”后进行升级操作时，可选择全量升级或滚动升级两种方式：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 部署NLP大模型
基本概念 - 盘古大模型 PanguLargeModels

基本概念账号用户注册华为云时的账号，账号对其所拥有的资源及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户，是云

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读

总条数： 64

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

发布文本类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

使用API调用NLP大模型 - 盘古大模型 PanguLargeModels

使用API调用科学计算大模型 - 盘古大模型 PanguLargeModels

手工编排Agent应用流程 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

管理盘古数据资产 - 盘古大模型 PanguLargeModels

使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

管理盘古模型资产 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

创建工作流 - 盘古大模型 PanguLargeModels

管理NLP大模型部署任务 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线