搜索_华为云

清洗文本类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据加工 > 数据清洗”，单击界面右上角“创建清洗任务”。在“创建清洗任务”页面，选择需要清洗的文本类数据集，单击“下一步”。进入“清洗步骤编排”页面。对于文本类数据集，可选择的清洗算子请参见文本类清洗算子能力清单。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
清洗图片类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据加工 > 数据清洗”，单击界面右上角“创建清洗任务”。在“创建清洗任务”页面，选择需要清洗的图片类数据集，单击“下一步”。进入“清洗步骤编排”页面。对于图片类数据集，可选择的清洗算子请参见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
配比文本类数据集 - 盘古大模型 PanguLargeModels

合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通文本类数据集。创建文本类数据集配比任务创建文本类数据集配比任务步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
流通图片类数据集 - 盘古大模型 PanguLargeModels

流通图片类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。单个图片类数据集支持发布的格式为：默认格式：平台默认的格式。盘古格式：训练盘古大模型时，需要将数据集格式发布为“盘古格式”。创建文本类数据集流通任务步骤如下：登录ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
流通文本类数据集 - 盘古大模型 PanguLargeModels

流通文本类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。单个文本类数据集支持发布的格式为：默认格式：平台默认的格式。在默认格式中，context和target是键值对。示例如下： {"context": "你好，请介绍自己", "target":

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
获取项目ID - 盘古大模型 PanguLargeModels

西南-贵阳一”区域，需要获取与贵阳一区域的对应的项目id。图2 获取项目ID 多项目时，展开“所属区域”，从“项目ID”列获取子项目ID。调用API获取项目ID 项目ID还可通过调用查询指定条件下的项目信息API获取。获取项目ID的接口为“GET https://{Endp

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

搜索增强通过结合大语言模型与传统搜索引擎技术，提升了搜索结果的相关性、准确性和智能化。例如，当用户提出复杂查询时，传统搜索引擎可能仅返回一系列相关链接，而大模型则能够理解问题的上下文，结合多个搜索结果生成简洁的答案，或提供更详细的解释，从而进一步改善用户的搜索体验。温度用于控制生成文本的多样性和创造力。调高温度会使得模型的输出更多样性和创新性。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 调用NLP大模型
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

ERA5是由欧洲中期天气预报中心（ECMWF）提供的全球气候的第五代大气再分析数据集，它覆盖从1940年1月至今的时间段，提供每小时的大气、陆地和海洋气候变量的估计值。 ERA5数据下载官方指导：https://confluence.ecmwf.int/display/CKB/

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

用任务的基础能力，但还没有针对特定的业务场景进行优化。预训练后的模型主要用于多个任务的底层支持。通过使用海量的互联网文本语料对模型进行预训练，使模型理解人类语言的基本结构。微调关注专业性：微调是对预训练模型的参数进行调整，使其在特定任务中达到更高的精度和效果。微调的核心在于

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

示例如下：去除“参考文献”以及之后的内容：\n参考文献[\s\S]* 针对pdf的内容，去除“0 引言”之前的内容，引言之前的内容与知识无关：[\s\S]{0，10000}0 引言针对pdf的内容，去除“1.1Java简介”之前的与知识无关的内容：[\s\S]{0，10000}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
应用 - 盘古大模型 PanguLargeModels

用户问题，作为运行Agent的输入。响应参数流式（Header中的stream参数为true）状态码： 200 表4 流式输出的数据单元参数参数类型描述 data String stream=true时，执行Agent的消息以流式形式返回。生成的内容以增量的方式逐步发送回来，

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > Agent开发
数据工程 - 盘古大模型 PanguLargeModels

提升数据治理的效率和效果。通过整合上述功能，数据工程在AI研发中不仅帮助用户高效构建高质量的训练数据集，还通过全流程的数据处理和管理，探索数据与模型性能的内在联系，为模型训练和应用提供坚实的数据基础，推动了模型的精确训练与持续优化，提升了AI应用开发的效率和成果的可靠性。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
工作流 - 盘古大模型 PanguLargeModels

插件配置，对应查询需要运行时传值的参数。响应参数流式（Header中的stream参数为true）状态码： 200 表5 流式输出的数据单元参数参数类型描述 data String stream=true时，执行工作流的消息以流式形式返回。生成的内容以增量的方式逐步发送

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > Agent开发
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

选择“微调”。基础模型选择所需微调的基础模型。训练参数数据集训练数据集。类别特征列指定使用LabelEncoder处理的字符串类型类别特征的列表。格式为["列名1","列名2"]，默认设置为[]，表示没有需要处理的类别特征。 LabelEncoder的作用是将类别特征转换为数值型特征，使模型能够处理这些特征。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
调用应用 - 盘古大模型 PanguLargeModels

应用调试成功后，可以使用API调用该应用。获取调用路径应用的调用路径获取步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。在“工作台 > 应用”页面，单击所需应用的“ > 调用路径”。图1 获取应用调用路径-1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用

总条数： 135

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

清洗文本类数据集 - 盘古大模型 PanguLargeModels

清洗图片类数据集 - 盘古大模型 PanguLargeModels

配比文本类数据集 - 盘古大模型 PanguLargeModels

流通图片类数据集 - 盘古大模型 PanguLargeModels

流通文本类数据集 - 盘古大模型 PanguLargeModels

获取项目ID - 盘古大模型 PanguLargeModels

使用“能力调测”调用NLP大模型 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

应用 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

工作流 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

调用应用 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线