搜索_华为云

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台中，使用数据工程构建盘古CV大模型数据集流程见表2。表2 盘古CV大模型数据集构建流程流程子流程说明操作指导导入数据至盘古平台创建导入任务将存储在OBS服务中的数据导入至平台统一管理，用于后续加工或发布操作。导入数据至盘古平台加工图片、视频类数据集清洗图片、视频类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

特点且可以引导观众购买。微调数据清洗：下表中列举了本场景常见的数据质量问题以及相应的清洗策略，供您参考：表1 微调数据清洗步骤数据问题清洗步骤与手段清洗前清洗后问题一：数据中存在超链接、异常符号等。删除数据中的异常字符。 {"context":"轻便折叠户外椅，

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台中，使用数据工程构建盘古NLP大模型数据集流程见表3。表3 盘古NLP大模型数据集构建流程流程子流程说明操作指导导入数据至盘古平台创建导入任务将存储在OBS服务中的数据导入至平台统一管理，用于后续加工或发布操作。导入数据至盘古平台加工文本类数据集清洗文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

明需要逻辑清晰、无歧义。设计任务要求要求分点列举：要求较多时需要分点列举，可以使用首先\然后，或1\2\3序号分点提出要求。每个要求步骤之间最好换行（\n）分隔断句，单个要求包含一项内容，不能太长。正负向要求分离：正负向要求不要掺杂着写，可以先全部列完正向要求，再列负向

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
模型开发 - 盘古大模型 PanguLargeModels

在问题并优化调整。评测功能能够帮助用户在多种应用场景下验证模型的准确性与可靠性。模型压缩：在模型部署前，进行模型压缩是提升推理性能的关键步骤。通过压缩模型，能够有效减少推理过程中的显存占用，节省推理资源，同时提高计算速度。当前，平台支持对NLP大模型进行压缩。模型部署：平台提

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
数据工程 - 盘古大模型 PanguLargeModels

本、视频、图片、气象类型的数据进行数据提取、过滤、转换、打标签和评分等加工处理。针对不同类型的数据集，平台提供了专用的清洗算子以及支持用户创建自定义算子实现个性化的数据清洗诉求。确保生成高质量的训练数据以满足业务需求和模型训练的要求。用户还可以灵活地调整算子编排顺序以及自定义清洗

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
错误码 - 盘古大模型 PanguLargeModels

API模型实例未公开。请检查是否具备盘古大模型服务的使用权限，或联系服务运维人员协助解决。 PANGU.3316 create agency fail. 创建代理失败。请联系服务运维人员协助解决。 PANGU.3317 max tokens Number Illegal. 最大token不合法

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
大模型开发基本概念 - 盘古大模型 PanguLargeModels

自监督学习（Self-Supervised Learning，简称SSL）是一种机器学习方法，它从未标记的数据中提取监督信号，属于无监督学习的一个子集。该方法通过创建“预设任务”让模型从数据中学习，从而生成有用的表示，可用于后续任务。它无需额外的人工标签数据，因为监督信号直接从数据本身派生。有监督学习

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
成长地图 - 盘古大模型 PanguLargeModels

挥盘古大模型在实际业务中的价值。快速入门使用盘古预置NLP大模型进行文本对话使用盘古应用百宝箱生成创意活动方案使用盘古NLP大模型创建Python编码助手应用 05 实践通过基模型训练出行业大模型和提示词写作的最佳实践，您将深入掌握行业模型的定制化流程与高效提示词构建方

 帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
撰写提示词 - 盘古大模型 PanguLargeModels

撰写提示词提示词是用来引导模型生成的一段文本。撰写的提示词应该包含任务或领域的关键信息，如主题、风格、格式等。撰写提示词时，可以设置提示词变量。即在提示词中通过添加占位符{{ }}标识表示一些动态的信息，让模型根据不同的情况生成不同的文本，增加模型的灵活性和适应性。例如，将提

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 撰写提示词
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
应用场景 - 盘古大模型 PanguLargeModels

数调优，最后才能上线应用。基于ModelArts Studio平台开发工作流，将数据标注、模型训练、部署上线等繁杂的流程固化为一个流水线的步骤。通过大模型的能力，即使只有少量样本，也可以达到良好的模型泛化性和鲁棒性，解决碎片化AI需求的问题。钢铁将预测大模型应用于钢铁煤炭行业

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

行问答对的过滤。下表列举了该场景常见的数据质量问题，以及相对应的清洗策略，供您参考：表1 微调数据问题与清洗策略序号数据问题清洗步骤与方式 1 问题或回答中带有不需要的特定格式内容或者时间戳等。通过编写代码、正则表达式等进行处理，删除或者修改对应的内容，或者直接过滤掉整条数据。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
管理盘古数据资产 - 盘古大模型 PanguLargeModels

管理盘古数据资产数据资产介绍数据资产是指在平台中被纳入管理、存储并可供使用的数据集。数据资产包含以下两种形式：用户自行发布的数据集。用户可以通过“数据工程 > 数据发布 > 数据流通”功能将数据集发布为数据资产。发布的数据集支持查看详细信息、编辑、删除以及发布至AI Gallery等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案工作流常见错误码与解决方案工作流常见报错及解决方案请详见表1。表1 工作流节点常见报错与解决方案模块名称错误码错误描述解决方案开始节点 101501 开始节点全局配置未传入值。开始节点错误，请联系客服解决。结束节点 101531

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
返回结果 - 盘古大模型 PanguLargeModels

返回结果状态码请求发送以后，您会收到响应，包含状态码、响应消息头和消息体。状态码是一组从1xx到5xx的数字代码，状态码表示了请求响应的状态，完整的状态码列表请参见状态码。对于Pangu服务接口，如果调用后返回状态码为“200”，则表示请求成功。响应消息头对应请求消息

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

数据集加工场景介绍数据加工介绍 ModelArts Studio大模型开发平台提供数据加工功能，涵盖了数据清洗、数据合成和数据标注关键操作，旨在确保原始数据符合业务需求和模型训练的标准，是数据工程中的核心环节。数据清洗通过专用的清洗算子对数据进行预处理，确保数据符合模型训练

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集

总条数： 183

上一页
1
...
6
7
8
9
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

模型开发 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

错误码 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

撰写提示词 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

管理盘古数据资产 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

返回结果 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线