搜索_华为云

数据工程使用流程 - 盘古大模型 PanguLargeModels

通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。合成数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。是否使用自定义L1预训练模型是否使用自定义预训练模型进行训练，模型为用户与服务共建，详情请联系客服。热身轮次表示在模型训练初期，逐步增加学习率到预设值的训练轮次，用于帮助模型在训练初期稳定收敛，避免大幅度的参数更新导致不稳定的学习过程。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
低代码构建多语言文本翻译工作流 - 盘古大模型 PanguLargeModels

低代码构建多语言文本翻译工作流方案设计构建流程效果评估与优化典型问题附录父主题： Agent应用实践

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

生成内容的字数要求为200个字左右； 2.生成的内容必须生动有趣、丰富多样； 3.生成内容的语言风格必须口语化； 4.生成的内容开头必须能足够引起观众的兴趣，比如可以采取对目标观众反问、对比等方式； 5.生成的内容结尾必须要引导观众购买； 6.生成的内容必须紧扣产品本身，突出产品的特点，不能出现不相关的内容； 7

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

从PDF中提取内容转换为结构化数据。 JSON内容提取提取JSON文件中的键值对信息。 HTML内容提取基于标签路径提取HTML数据内容，并将其他与待提取标签路径无关的内容删除。电子书内容提取从电子书中提取出所有文本内容。智能文档解析从PDF（支持扫描版）或图片中提取文本，转化为结构化

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

有针对特定的业务场景进行优化。预训练后的模型主要用于多个任务的底层支持。通过使用海量的互联网文本语料对模型进行预训练，使模型理解人类语言的基本结构。微调关注专业性：微调是对预训练模型的参数进行调整，使其在特定任务中达到更高的精度和效果。微调的核心在于利用少量的特定任务数据，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
数据工程介绍 - 盘古大模型 PanguLargeModels

数据清洗：数据清洗旨在通过使用数据集清洗算子对数据进行预处理操作，针对不同类型的数据集，平台设计了专用的清洗算子，以确保数据符合模型训练的标准和业务需求。数据合成：数据合成利用预置或自定义的数据指令对原始数据集进行处理，并根据设定的轮数生成新的数据。数据标注：数据标注旨在为无标签的数

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。清洗文本类数据集合成文本类数据集利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

通过合理的数据配比，帮助用户按特定比例组合多个数据集，确保数据集在不同任务场景下的多样性和代表性。这样可以避免过度偏向某一类数据，保证模型能够学习到多种特征，提升对各种情况的适应能力。多格式支持对于文本类、图片类数据集，平台支持多种数据发布格式，包括“默认格式”、“盘古格式”，以满足不同训练任务的需

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

加工图片、视频类数据集清洗图片、视频类数据集通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。清洗图片类数据集、清洗视频类数据集标注图片、视频类数据集为无标签数据集添加准确的标签

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

选择“盘古大模型”。模型类型选择“NLP大模型”。训练类型选择“微调”。训练目标选择“全量微调”。全量微调：在模型进行有监督微调时，对大模型的所有参数进行更新。这种方法通常能够实现最佳的模型性能，但需要消耗大量计算资源和时间，计算开销较大。基础模型选择全量微调所用的基础模型，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
创建推理作业 - 盘古大模型 PanguLargeModels

确定性预报的输出要素，例如“Surface:U;1000:T;800:?abc”。可选择的要素参考表8中，提供的全球海洋要素模型的深海变量和海表变量。表8 中期海洋智能预测模型信息模型深海层深预报深海变量预报海表变量时间分辨率水平分辨率区域范围全球海洋要素模型 0m, 6m, 10m, 20m

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > 科学计算大模型 > 海洋模型
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

导入数据至盘古平台加工气象类数据集清洗气象类数据集通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。清洗气象类数据集发布气象类数据集流通气象类数据集数据流通是将单个数据集发布为特定格

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
常见问题 - 盘古大模型 PanguLargeModels

服务端返回的json数据不符合json反序列化的规则，和sdk定义的数据结构不一致，导致反序列化失败。 sdk json数据解析问题。建议排查服务端返回的数据是否和服务SDK设计的结构、字段一致。 SDK运行报错 java.lang.NoClassDefFoundError: Could not initialize

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

JSON，包含“context”和“target”两个字段。示例如下： {"context": "今天是2023-11-20，你是一个银行智能助理，现在需要根据用户问题、指标-解释表、参数-类型-解释表，生成符合要求格式的json。\n\n请学习并记住以下背景知识:\n1.jso

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
管理盘古模型资产 - 盘古大模型 PanguLargeModels

的基本信息与操作记录。编辑属性。单击操作列的“编辑属性”，可修改模型资产名称、描述以及资产可见性。训练、压缩、部署。可在模型列表页面，对模型执行训练、压缩或部署操作。单击相应按钮，将跳转至相关操作页面。导出盘古大模型至其他局点导出盘古大模型至其他局点前，请确保当前空间为该用户所创建的空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。此外，若可预见实际场景会不断发生变化，建议您定期更新训练数据，对模型进行微调更新。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

"caption":"图片对应的文本描述"} 单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。图片+QA对图片支持tar，QA对支持jsonl 图片：图片以tar包格式存储，可以多个tar包。tar包存储原始的图片，每张图片命名要求唯一（如abc.jpg）

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
创建知识库 - 盘古大模型 PanguLargeModels

知识库创建完成后，如果想在当前知识库中继续上传文件，可单击该知识库进入详情页面，再单击右上角“继续上传”，上传本地文件。知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最终输出与查询相关的信息，并根据匹配的程度进行排序。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
创建提示词评估任务 - 盘古大模型 PanguLargeModels

选择评估使用的变量数据集和评估方法。评估用例集：根据选择的数据集，将待评估的提示词和数据集中的变量自动组装成完整的提示词，输入模型生成结果。评估方法：根据选择的评估方法，对模型生成结果和预期结果进行比较，并根据算法给出相应的得分。图2 创建提示词评估任务单击“确定”，评估任务自动进入执行状态。父主题：批量评估提示词效果

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果

总条数： 68

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据工程使用流程 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

低代码构建多语言文本翻译工作流 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

使用数据工程构建CV大模型数据集 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

创建推理作业 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

管理盘古模型资产 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

创建提示词评估任务 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线