搜索_华为云

使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建数据集数据工程介绍数据工程使用流程数据集格式要求导入数据至盘古平台加工数据集发布数据集数据工程常见报错与解决方案

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

平台提供的数据发布功能，用户能够根据具体任务需求，灵活选择数据发布格式，保证数据的兼容性与一致性，从而为后续模型训练和应用部署打下坚实基础。支持数据发布的数据集类型支持数据发布的数据集类型见表1。表1 支持数据发布的数据集类型数据类型数据评估数据配比数据流通文本类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
数据保护技术 - 盘古大模型 PanguLargeModels

数据保护技术盘古大模型服务通过多种数据保护手段和特性，保障存储在服务中的数据安全可靠。表1 盘古大模型的数据保护手段和特性数据保护手段简要说明传输加密（HTTPS）盘古服务使用HTTPS传输协议保证数据传输的安全性。基于OBS提供的数据保护基于OBS服务对用户的数

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格盘古NLP大模型是业界首个超千亿参数的中文预训练大模型，结合了大数据预训练和多源知识，借助持续学习不断吸收海量文本数据，持续提升模型性能。除了实现行业知识检索、文案生成、阅读理解等基础功能外，盘古NLP大模型还具备模型调用等高级特性，可在智能客服、创意

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据获取 > 原始数据集”，单击需要查看的数据集名称。查看数据集基本信息。在“基本信息”页签，可以查看数据详情、数据来源以及扩展信息。下载原始数据集。在“数据预览”页签，可以查看数据内容，单击右上角“下载”即可下载原始数据集。查看数据血缘。在“数据血缘”

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集预测大模型支持接入的数据集类型盘古预测大模型仅支持接入预测类数据集，不同模型所需数据见表1，该数据集格式要求请参见预测类数据集格式要求。表1 预测大模型与数据集类型对应关系基模型模型分类数据集内容文件格式预测大模型时序预测模型时序数据

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
发布数据集 - 盘古大模型 PanguLargeModels

发布数据集数据集发布场景介绍发布文本类数据集发布图片类数据集发布视频类数据集发布气象类数据集发布预测类数据集发布其他类数据集管理发布后的数据集父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
加工数据集 - 盘古大模型 PanguLargeModels

加工数据集数据集加工场景介绍数据集清洗算子介绍加工文本类数据集加工图片类数据集加工视频类数据集加工气象类数据集管理加工后的数据集父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
大模型开发基本概念 - 盘古大模型 PanguLargeModels

说明自监督学习自监督学习（Self-Supervised Learning，简称SSL）是一种机器学习方法，它从未标记的数据中提取监督信号，属于无监督学习的一个子集。该方法通过创建“预设任务”让模型从数据中学习，从而生成有用的表示，可用于后续任务。它无需额外的人工标签数据，因为监督信号直接从数据本身派生。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
Token计算器 - 盘古大模型 PanguLargeModels

为了帮助用户更好地管理和优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量，提供费用预估，并优化数据预处理策略。 URI POST /v1/{project_id}/deployments/{deployment_id}/caltokens 表1

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API
创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

表示在模型训练初期，逐步增加学习率到预设值的训练轮次，用于帮助模型在训练初期稳定收敛，避免大幅度的参数更新导致不稳定的学习过程。热身阶段学习率热身轮次中使用的初始学习率。优化器优化器参数用于更新模型的权重。 sgd（随机梯度下降法）是深度学习中常用的优化算法之一，尤其适用于大规模数据集的训练。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
添加CoT思维链提示 - 盘古大模型 PanguLargeModels

更高的结果。单样本/多样本可以在提示词中提供示例，让模型先学习后回答，在使用这种方法时需要约束新样例不能照抄前面给的参考样例，新样例必须多样化、不能重复等，否则可能会直接嫁接前文样例的内容，也可以约束只是让它学习参考样例的xxx生成思路、xxx风格、xxx生成方法等。零样本

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
概述 - 盘古大模型 PanguLargeModels

概述盘古大模型整合华为云强大的计算和数据资源，将先进的AI算法集成在预训练大模型中，打造出具有深度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。盘古大模型在ModelArts Studio大模型开发平台部署后，可以通过API调用推理接口。表1 API清单

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
清洗视频类数据集 - 盘古大模型 PanguLargeModels

在完成数据清洗后，如果无需使用数据标注功能，可直接在“数据清洗”页面单击操作列“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：加工视频类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
发布其他类数据集 - 盘古大模型 PanguLargeModels

在“创建流通任务”页面，选择数据集模态，如“其他 > 自定义”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前其他类数据集仅支持发布默认格式。填写数据集名称、描述，设置数据集“资产可见性”，设置扩展信息后，单击“确定”执行数据集流通操作。当任

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
评估文本类数据集 - 盘古大模型 PanguLargeModels

节至创建文本类数据集评估任务。创建文本类数据集评估标准步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“数据工程 > 数据发布 > 数据评估”，在“人工评估标准”页签，平台预置了文本类数据集评估标准“NLP数据质量标准

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
配比文本类数据集 - 盘古大模型 PanguLargeModels

配比文本类数据集数据配比是将多个数据集按照特定比例关系组合并发布为“发布数据集”的过程，确保数据的多样性、平衡性和代表性。如果单个数据集已满足您的需求，可跳过此章节至流通文本类数据集。创建文本类数据集配比任务创建文本类数据集配比任务步骤如下：登录ModelArts St

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
流通视频类数据集 - 盘古大模型 PanguLargeModels

式。填写数据集名称、描述，设置数据集“资产可见性”，设置扩展信息后，单击“确定”执行数据集流通操作。当任务状态显示为“运行成功”时，说明数据流通任务执行成功，生成的“发布数据集”可在“数据工程 > 数据发布 > 发布数据集”中查看。父主题：发布视频类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
清洗文本类数据集 - 盘古大模型 PanguLargeModels

在完成数据清洗后，如果无需使用数据合成与数据标注功能，可直接在“数据清洗”页面单击操作列“生成”，生成加工数据集。加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。父主题：加工文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工文本类数据集
发布预测类数据集 - 盘古大模型 PanguLargeModels

在“创建流通任务”页面，选择数据集模态，如“预测 > 时序”类型的数据集。图1 选择数据集模态选择数据集，单击“下一步”。在“格式配置”选择发布格式。当前预测类数据集仅支持发布默认格式。填写数据集名称、描述，设置数据集“资产可见性”，设置扩展信息后，单击“确定”执行数据集流通操作。当任务

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集

总条数： 184

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

数据保护技术 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

发布数据集 - 盘古大模型 PanguLargeModels

加工数据集 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

Token计算器 - 盘古大模型 PanguLargeModels

创建CV大模型训练任务 - 盘古大模型 PanguLargeModels

添加CoT思维链提示 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

清洗视频类数据集 - 盘古大模型 PanguLargeModels

发布其他类数据集 - 盘古大模型 PanguLargeModels

评估文本类数据集 - 盘古大模型 PanguLargeModels

配比文本类数据集 - 盘古大模型 PanguLargeModels

流通视频类数据集 - 盘古大模型 PanguLargeModels

清洗文本类数据集 - 盘古大模型 PanguLargeModels

发布预测类数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线