搜索_华为云

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

25km*25km。全球范围，纬度90N~-90S，经度0W~360E。训练集和验证集均推荐使用>1个月的历史数据。训练数据一般可通过公开数据集获取，例如ERA5。ERA5是由欧洲中期天气预报中心（ECMWF）提供的全球气候的第五代大气再分析数据集，它覆盖从1940年1月

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

频。视频涉政评分对视频的涉政程度进行评分，分数越高越危险。评分范围(0, 100)，评分≥90分的视频可视为涉政视频。运动幅度评分通过计算每个像素在每一帧中的移动范围进行评分，识别运动幅度过快（如＞100光流）或过慢（如≤2光流）的视频，数值越大表示运动过快。质量基础评分

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍
空间管理 - 盘古大模型 PanguLargeModels

此外，平台还提供了导入和导出功能，支持用户将其他局点的盘古大模型迁移到本地局点，这使得模型资产在不同局点间的共享和管理变得更加灵活高效。通过统一管理空间资产，平台不仅帮助用户高效组织和利用资源，还保障了资产的安全性、一致性与灵活性。这些功能的结合，确保了平台上资源的高效利用与智

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

数值越高，表明模型性能越好。获取训练日志单击训练任务名称，可以在“日志”页面查看训练过程中产生的日志。对于训练异常或失败的任务也可以通过训练日志定位训练失败的原因。典型训练报错和解决方案请参见NLP大模型训练常见报错与解决方案。训练日志可以按照不同的节点（训练阶段）进行筛

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

创建原始数据集上线原始数据集在正式发布数据集前，需要执行上线操作。上线原始数据集加工数据集创建文本类数据集加工任务数据集中若存在异常数据，可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。说明：盘古NLP大模型仅支持接入文本类数据集。若数据类型为文档、网页，则加工数据集为必选项，否则为可选项。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
发布文本类数据集 - 盘古大模型 PanguLargeModels

定义格式： “默认格式”为数据工程功能支持的原始格式。 “盘古格式”为使用盘古大模型训练或评测时所需要使用的数据格式。 “自定义格式”可以通过自定义格式转换脚本，将数据集转化为适用于其他模型的格式。例如盘古数据集中，context、target字段分别表示问题和答案。对于Alpa

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
发布图片类数据集 - 盘古大模型 PanguLargeModels

定义格式： “默认格式”为数据工程功能支持的原始格式。 “盘古格式”为使用盘古大模型训练或评测时所需要使用的数据格式。 “自定义格式”可以通过自定义格式转换脚本，将数据集转化为适用于其他模型的格式。例如盘古数据集中，context、target字段分别表示问题和答案。对于Alpa

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 发布数据集
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

41030 - 此版本是2024年10月发布的百亿级模型版本，支持模型增量预训练。基于Snt9B3卡支持32卡起训，预训练后的模型版本需要通过SFT之后，才可支持推理部署。 Pangu-NLP-N2-Chat-32K-20241030 32K 此版本是2024年10月发布的百亿级

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

实际任务需求。例如，区域海洋要素预测的微调是在已有模型上添加最新数据，不改变模型结构参数或引入新要素，以适应数据更新需求。在实际流程中，通过设定训练指标对模型进行监控，以确保效果符合预期。在微调后，评估用户模型，并进行最终优化，确认其满足业务需求后，进行部署和调用，以便实际应用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

但同时也可能会降低模型的拟合能力。取值范围：[0,1)。给输入数据加噪音的概率定义了给输入数据加噪音的概率。加噪音是一种正则化技术，它通过在输入数据中添加随机噪音来增强模型的泛化能力。取值范围：[0,1]。给输入数据加噪音的尺度定义了给输入数据加噪音的尺度。这个值越大，添

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 训练科学计算大模型
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

科技行业公司的最小利润和市值是多少？科技行业公司的中位利润和市值是多少？科技行业公司的总利润和市值是多少？ … 来源四：基于大模型的数据泛化。基于目标场任务的分析，通过人工标注部分数据样例，再基于大模型（比如盘古提供的任意一个规格的基础功能模型）采用self-instruct等方式泛化出更多的业务场景数据。示例如下：

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

段落完整性。句子特征过滤根据如下特征过滤：过滤平均句长小于阈值的文档。词语特征过滤根据如下特征过滤：词个数。平均词长度。语种过滤通过语种识别模型得到文档的语言类型，筛选所需语种的文档。段落结尾不完整句子过滤删除文本中不完整段落和句子。广告数据过滤删除文本中包含广告数据的句子。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程准备与处理数据集 > 加工数据集 > 数据集加工算子介绍

总条数： 112

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

视频类加工算子能力清单 - 盘古大模型 PanguLargeModels

空间管理 - 盘古大模型 PanguLargeModels

查看NLP大模型训练状态与指标 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

发布文本类数据集 - 盘古大模型 PanguLargeModels

发布图片类数据集 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

科学计算大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

创建科学计算大模型训练任务 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

文本类加工算子能力清单 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线