搜索_华为云

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

数据预处理：数据预处理是数据准备过程中的重要环节，旨在提高数据质量和适应模型的需求。常见的数据预处理操作包括：去除重复数据：确保数据集中每条数据的唯一性。填补缺失值：填充数据中的缺失部分，常用方法包括均值填充、中位数填充或删除缺失数据。数据标准化：将数据转换为统一的格式或范围，特别是在处理数值型数据时（如归一化或标准化）。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 ModelArts Studio平台支持从OBS服务导入数据。您可以将本地数据上传至OBS（对象存储服务），然后通过平台提供的“数据导入”功能，将存储在OBS中的数据导入至平台进行使用。具体操作步骤如下：上传数据至OBS：将本地数据上传至OBS服务，请详见通过控制台快速使用OBS。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳提示词与训练数据的相似度关系。提示词的效果通常与训练数据的相似度密切相关。当提示词的内容与模型在训练过程中接触过的样本数据相似时，模型更容易理解提示词并生成相关的输出。这是因为模型通过学习大量的训练数据，逐渐建立起对特定模式、结构和语言的理解，因

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好这种情况可能是由于以下原因导致的，建议您排查：数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大、样本中存在异常数据、样本的多样性较差，都将影响模型训练的效果，建议提升您的数据质量。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
编排工作流 - 盘古大模型 PanguLargeModels

助手、工单助手、娱乐互动等场景。任务型工作流。面向自动化处理场景，基于输入内容直接输出结果，无中间的对话交互过程。适用于内容生成、批量翻译、数据分析等场景。其中，任务型工作流不支持配置消息节点和提问器节点。工作流编排流程见表1。表1 工作流编排流程操作步骤说明步骤1：创建工作流

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用工作流
盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

逻辑操作、离散条件、范围区间等条件的混合和嵌套）、日期操作，支持多表关联查询。与非专业大模型相比，专业大模型针对特定场景优化，更适合执行数据分析、报告生成和业务洞察等任务。 ModelArts Studio大模型开发平台为用户提供了多种规格的专业大模型，以满足不同场景和需求。以

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
导入数据过程中，为什么无法选中OBS的具体文件进行上传 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的具体文件进行上传在数据导入过程中，平台仅支持通过OBS服务导入文件夹类型的数据，而不支持直接导入单个文件。您需要将文件整理到文件夹中，并选择该文件夹进行上传。父主题：大模型使用类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

训练参数训练轮数表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。数据批量大小数据集进行分批读取训练，设定每个批次数据的大小。通常情况下，较大的数据批量可以使梯度更加稳定，从而有利于模型的收敛。然而，较大的数据批量也会占用更多的显存资源，这可能导致显存不足，并且会延长每次训练的时长。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
产品优势 - 盘古大模型 PanguLargeModels

Studio大模型开发平台数据、模型、Agent应用在统一的入口进行管理，可以快速的掌握资产的使用情况、版本情况和溯源信息等。海量训练数据盘古大模型依托海量且多样化的训练数据，涵盖从日常对话到专业领域的广泛内容，帮助模型更好地理解和生成自然语言文本，适用于多个领域的业务应用。这些数据不仅丰富多

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

构建的优点是数据丰富度更高，缺点是成本较高。当您将无监督数据构建为有监督数据时，请尽可能保证数据的多样性。建议将不同文本构建为不同的场景，甚至将同一段文本构建为多个不同的场景。不同规格的模型支持的长度不同，当您将无监督数据构建为有监督数据时，请确保数据长度符合模型长度限制。父主题：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

微调数据清洗：以下是该场景中实际使用的数据清洗策略，供您参考：原始文本处理。基于爬虫、数据处理平台批量处理收集到的原始数据，需要将文件统一转换成纯文本的txt文件，对错误格式数据进行删除。构建微调数据。生成垂域微调（问答对）数据，将问答对数据分为：单轮问答数据、多轮问答

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

'EQUAL-TO'}]}}"} 数据量级要求：本场景使用了30000条数据进行微调。类似场景需要的微调数据量视具体情况而定，从经验上来说，若实际场景相对简单和通用，使用几千条数据即可；若场景复杂或专业，则需要上万条数据。数据质量要求：保证数据的分布和目标需要与实际场景匹配。保证数据的覆盖度：数

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、审计和数据主权保护等机制。在训练和推理过程中，通过数据脱敏、隐私计算

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

训练目的训练数据模型效果应用场景举例预训练关注通用性：预训练旨在让模型学习广泛的通用知识，建立词汇、句法和语义的基础理解。通过大规模的通用数据训练，模型可以掌握丰富的语言模式，如语言结构、词义关系和常见的句型。使用大规模通用数据：通常使用海量的无监督数据（如文本语料库

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

Studio大模型开发平台的空间资产中，包括数据和模型两类资产。这些资产为用户提供了集中管理和高效操作的基础，便于用户实现统一查看和操作管理。数据资产：用户已发布的数据集将作为数据资产存放在空间资产中。用户可以查看数据集的详细信息，包括数据格式、大小、配比比例等。同时，平台支持数据集的删除等管理操作，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
概述 - 盘古大模型 PanguLargeModels

概述盘古大模型整合华为云强大的计算和数据资源，将先进的AI算法集成在预训练大模型中，打造出具有深度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。盘古大模型在ModelArts Studio大模型开发平台部署后，可以通过API调用推理接口。表1 API清单

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读

总条数： 176

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

如何将本地的数据上传至平台 - 盘古大模型 PanguLargeModels

为什么其他大模型适用的提示词在盘古大模型上效果不佳 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型的回答中会出现乱码 - 盘古大模型 PanguLargeModels

数据量足够，为什么盘古大模型微调效果仍然不好 - 盘古大模型 PanguLargeModels

编排工作流 - 盘古大模型 PanguLargeModels

盘古专业大模型能力与规格 - 盘古大模型 PanguLargeModels

导入数据过程中，为什么无法选中OBS的具体文件进行上传 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线