搜索_华为云

数据集清洗算子介绍 - 盘古大模型 PanguLargeModels

数据集清洗算子介绍文本类清洗算子能力清单视频类清洗算子能力清单图片类清洗算子能力清单气象类清洗算子能力清单父主题：加工数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
数据集格式要求 - 盘古大模型 PanguLargeModels

数据集格式要求文本类数据集格式要求图片类数据集格式要求视频类数据集格式要求气象类数据集格式要求预测类数据集格式要求其他类数据集格式要求父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
准备工作 - 盘古大模型 PanguLargeModels

Key（SK）。下载的访问密钥为credentials.csv文件，包含AK/SK信息。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。使用推理SDK章节示例代码均以ak和sk保存在环境变量中来实现身份验证。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
编排应用 - 盘古大模型 PanguLargeModels

用于配置大模型的输出多样性。包含取值：精确的：模型的输出内容严格遵循指令要求，可能会反复讨论某个主题，或频繁出现相同词汇。平衡的：平衡模型输出的随机性和准确性。创意性的：模型输出内容更具多样性和创新性，某些场景下可能会偏离主旨。自定义：自定义大模型输出的温度和核采样值，生成符合预期的输出。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
错误码 - 盘古大模型 PanguLargeModels

token解析失败，请检查获取token的方法，请求体信息是否填写正确，token是否正确；检查获取token的环境与调用的环境是否一致。 token超时（token expires），请重新获取token，使用不过期的token。请检查AK/SK是否正确（AK对应的SK错误，不匹配；AK/SK中多填了空格）。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据发布功能通过数据评估和配比，确保发布的数据集满足大模型训练的高标准。这不仅包括数据规模的要求，还涵盖了数据质量、平衡性和代表性的保证，避免数据不均衡或不具备足够多样性的情况，进而提高模型的准确性和鲁棒性。提高数据的多样性和代表性通过合理的数据配比，帮助用户按特定比例组合多个数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
合成文本类数据集 - 盘古大模型 PanguLargeModels

自定义指令。平台支持编排用户自定义指令。自定义指令的创建详见创建自定义数据合成指令。指令选择完成后，单击“确定”，并配置指令参数，包括“变量取值”、“保存至任务输出参数”、“模型选择”。如图1，展示了预训练文本类数据集的合成指令参数配置示例，该合成任务实现利用预训练文本生成问答对。图1 预训练文本类数据集合成指令参数配置示例

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

服务，便捷地构建自己的模型和应用。数据工程工具链：数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分，具备数据获取、数据加工和数据发布等功能，确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据，满足不同训练任务的需求，并提供强大的数据存储和管理能力，为大模型训练提供坚实的数据支持。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
认证鉴权 - 盘古大模型 PanguLargeModels

Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存，避免频繁调用。如果您的华为云账号已升级为

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

义信息。数据集版权。训练模型的数据集除用户自行构建外，也可能会使用开源的数据集。数据集版权功能主要用于记录和管理数据集的版权信息，确保数据的使用合法合规，并清晰地了解数据集的来源和相关的版权授权。通过填写这些信息，可以追溯数据的来源，明确数据使用的限制和许可，从而保护数据版权并避免版权纠纷。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

海洋气象数据通常来源于气象再分析。气象再分析是通过现代气象模型和数据同化技术，重新处理历史观测数据，生成高质量的气象记录。这些数据既可以覆盖全球范围，也可以针对特定区域，旨在提供完整、一致且高精度的气象数据。再分析数据为二进制格式，具体格式要求详见表1。表1 气象类数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。配比文本类数据集流通文本类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”，用于后续模型训练等操作。平台支持发布的数据集格式为默认格式、盘古格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
插件介绍 - 盘古大模型 PanguLargeModels

返回。这样的设计使得Agent能够智能处理复杂任务，甚至跨领域解决问题，实现对复杂问题的自动化处理。 Agent开发平台支持两种类型的插件：预置插件：平台为开发者和用户提供了预置插件，直接可用，无需额外开发。例如，平台提供的“Python解释器插件”能够根据用户输入的问题自动生

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
模型开发 - 盘古大模型 PanguLargeModels

型训练到模型调用的各个环节。平台支持全流程的模型生命周期管理，确保从数据准备到模型部署的每一个环节都能高效、精确地执行，为实际应用提供强大的智能支持。模型训练：在模型开发的第一步，ModelArts Studio大模型开发平台为用户提供了丰富的训练工具与灵活的配置选项。用户可以

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
查询推理作业详情 - 盘古大模型 PanguLargeModels

功能介绍根据创建推理作业的作业ID获取科学计算大模型的结果数据。 URI 获取URI方式请参见请求URI。 GET /tasks/{task_id} 调用查询推理作业详情API所需要的域名与创建推理作业API一致，可以参考创建推理作业获取。获取完整的创建推理作业API后，在这个

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 海洋模型
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

生成的内容结尾必须要引导观众购买； 6.生成的内容必须紧扣产品本身，突出产品的特点，不能出现不相关的内容； 7.生成的内容必须完整，必须涵盖产品介绍中的每个关键点，不能丢失任何有价值的细节； 8.生成的内容必须符合客观事实，不能存在事实性错误； 9.生成的内容必须语言通顺； 10.生成的内容中不能出现“带货口播”等这一类字样；

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
查询推理作业详情 - 盘古大模型 PanguLargeModels

功能介绍根据创建推理作业的作业ID获取科学计算大模型的结果数据。 URI 获取URI方式请参见请求URI。 GET /tasks/{task_id} 调用查询推理作业详情API所需要的域名与创建推理作业API一致，可以参考创建推理作业获取。获取完整的创建推理作业API后，在这个

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 气象/降水模型
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

模型训练的标准，是数据工程中的核心环节。数据清洗通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。数据合成利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
使用盘古应用百宝箱生成创意活动方案 - 盘古大模型 PanguLargeModels

通用”页签，单击“创意活动方案生成”进入该应用。图1 “创意活动方案生成”应用如图2，在应用页面，输入所需的活动主题与活动描述，单击“创作”。图2 活动主题与描述该预置应用将根据所输入的主题与描述，在“结果生成”中生成相应的创意活动方案。图3 创意活动方案生成结果

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置得过小，导致模型的收敛速度太慢，无法达到最优解。您可以尝试增大训练轮数或者增大学习率的方式来解决。图4 异常的Loss曲线：平缓且保持高位

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题

总条数： 144

上一页
1
...
4
5
6
7
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集清洗算子介绍 - 盘古大模型 PanguLargeModels

数据集格式要求 - 盘古大模型 PanguLargeModels

准备工作 - 盘古大模型 PanguLargeModels

编排应用 - 盘古大模型 PanguLargeModels

错误码 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

合成文本类数据集 - 盘古大模型 PanguLargeModels

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

插件介绍 - 盘古大模型 PanguLargeModels

模型开发 - 盘古大模型 PanguLargeModels

查询推理作业详情 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

查询推理作业详情 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

使用盘古应用百宝箱生成创意活动方案 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线