搜索_华为云

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。父主题：数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
构建微调训练任务 - 盘古大模型 PanguLargeModels

给输出数据加噪音的概率，定义了给输出数据加噪音的概率。加噪音是一种正则化技术，它通过在模型的输出中添加随机噪音来增强模型的泛化能力。取值范围：[0,1]。给输出数据加噪音的尺度给输出数据加噪音的尺度，定义了给输出数据加噪音的尺度。这个值越大，添加的噪音越强烈，模型的正则化效果越强，但同时也可能会降低模型的拟合能力。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
管理知识库 - 盘古大模型 PanguLargeModels

Agent开发平台支持对知识库执行获取知识库ID、删除、命中测试操作。新增、删除知识库中知识文档登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。进入“工作台 > 知识库”页面。单击所需知识库，进入详情页面。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
认证鉴权 - 盘古大模型 PanguLargeModels

Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存，避免频繁调用。如果您的华为云账号已升级为

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

ERA5是由欧洲中期天气预报中心（ECMWF）提供的全球气候的第五代大气再分析数据集，它覆盖从1940年1月至今的时间段，提供每小时的大气、陆地和海洋气候变量的估计值。 ERA5数据下载官方指导：https://confluence.ecmwf.int/display/CKB/

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
构建部署任务 - 盘古大模型 PanguLargeModels

设置模型部署参数信息。计费模式选择计费模式。实例数设置部署模型时所需的实例数，单次部署服务时，部署实例个数建议不大于10，否则可能触发限流导致部署失败。基本信息服务名称设置部署任务的名称。描述（选填）设置部署任务的描述。图1 创建全球区域中期海洋智能预测部署任务父主题：盘古科学计算大模型微调训练实践

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
创建专业大模型部署任务 - 盘古大模型 PanguLargeModels

在“从资产选模型”选择所需模型。部署方式云上部署：算法部署至平台提供的资源池中。安全护栏选择模式安全护栏保障模型调用安全。选择类型当前支持安全护栏基础版，内置了默认的内容审核规则。资源配置计费模式包年包月计费模式。实例数设置部署模型时所需的实例数。订阅提醒订阅提醒该功能开启后，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古专业大模型 > 部署专业大模型
创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

法部署至平台提供的资源池中。边缘部署指算法部署至客户的边缘设备中（仅支持边缘部署的模型可配置边缘部署）。部分模型资产支持边缘部署方式，若选择“边缘部署”：本地挂载路径（选填）：在容器内部将卷挂载的本地路径。挂载后，容器中的应用程序可以通过这个路径访问宿主机上的数据。资源池：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 部署科学计算大模型
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

学习率决定每次训练中模型参数更新的幅度。选择合适的学习率至关重要：如果学习率过大，模型可能无法收敛。如果学习率过小，模型的收敛速度将变得非常慢。训练轮数表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。 Lora矩阵的轶较高的取值意味着更多的参数被更新，模型具有更大的灵活性，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据获取”，单击界面右上角“创建导入任务”。在“创建导入任务”页面选择所需要的“文件内容”、“文件格式”、“导入来源”，并单击“选择路径”上传数据文件。 NLP大模型评测数据集支持的格式见表1。表1 评测数据集格式模型类型评测数据集格式 NLP大模型文本-单轮问答-jsonl格式

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
评估视频类数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台针对视频类数据集预设了一套基础评估标准，涵盖了视频的清晰度、帧率、完整性、标签准确性等多个质量维度，用户可以直接使用该标准或在该标准的基础上创建评估标准。若您希望使用平台预置的评估标准，可跳过此章节至创建视频类数据集评估任务。创建视频类数据集评估标准步骤如下：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

两种方式，用户可根据需求选择合适的标注方式。数据标注的质量直接影响模型的训练效果和精度。标注文本类数据集配比文本类数据集数据配比是将多个数据集按特定比例组合的过程。通过合理的配比，确保数据集的多样性、平衡性和代表性，避免因数据分布不均而引发的问题。配比文本类数据集发布文本类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
大模型开发基本概念 - 盘古大模型 PanguLargeModels

多样性和一致性是评估LLM生成语言的两个重要方面。多样性指模型生成的不同输出之间的差异。一致性指相同输入对应的不同输出之间的一致性。重复惩罚重复惩罚（repetition_penalty）是在模型训练或生成过程中加入的惩罚项，旨在减少重复生成的可能性。通过在计算损失函数（用于优化模型的指标）时增加

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
状态码 - 盘古大模型 PanguLargeModels

返回一个资源特征与地址的列表用于用户终端（例如：浏览器）选择。 301 Moved Permanently 永久移动，请求的资源已被永久的移动到新的URI，返回信息会包括新的URI。 302 Found 资源被临时移动。 303 See Other 查看其他地址，使用GET和POST请求查看。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
大模型微调训练类 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常如何调整推理参数，使盘古大模型效果最优为什么微调后的盘古大模型总是重复相同的回答为什么微调后的盘古大模型的回答中会出现乱码为什么微调后的盘古大模型的回答会异常中断为什么微调后的盘古大模型只能回答训练样本中的问题为什么在微调后的盘古大模型中输入训练样本问题，回答完全不同

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
调优典型问题 - 盘古大模型 PanguLargeModels

通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。结合数据自身特征，进行异常数据的筛选。对于异常值，视情况进行删除、替换、保留等操作，兼顾模型的收敛与鲁棒性。删除异常值后，盐度（S）损失收敛正常，如图4。表2 验证集选择的时间区段时间分辨率推理步数验证集选择的时间区段（需要至少在以下

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。 content type [%s] not support, only [%s] support. 数据集中的内容不支持，请保证上传的数据格式与平台要求的一致。 get obs bucket folders error. 请检查OBS服务是否正常，是否可以访问OBS桶数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

意图识别prompt模板请求失败。检查模板占位符与输入是否匹配。 101097 意图识别调用大模型的prompt不符合模型输入的规范。检查输入的prompt格式，消息的角色和内容。 101096 意图识别调用大模型失败。检查消息的格式，内容以及大模型服务是否正常。 101095 意图识别用户query输入/引用解析失败。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
微调典型问题 - 盘古大模型 PanguLargeModels

通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。结合数据自身特征，进行异常数据的筛选。对于异常值，视情况进行删除、替换、保留等操作，兼顾模型的收敛与鲁棒性。删除异常值后，盐度（S）损失收敛正常，如图4。表2 验证集选择的时间区段时间分辨率推理步数验证集选择的时间区段(验证集需要至少在以下时间点内，有连续数据

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
NLP大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

{1:'apple', 2:'orange', 3:'banana'} 训练集中的标签个数与验证集中的个数不一致，导致该错误发生。例如，训练集中的标签共有4个，验证集中的标签只有3个。请保持数据中训练集和验证集的标签数量一致。父主题：训练NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型

总条数： 233

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

构建微调训练任务 - 盘古大模型 PanguLargeModels

管理知识库 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

构建部署任务 - 盘古大模型 PanguLargeModels

创建专业大模型部署任务 - 盘古大模型 PanguLargeModels

创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

创建NLP大模型评测数据集 - 盘古大模型 PanguLargeModels

评估视频类数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

大模型微调训练类 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

微调典型问题 - 盘古大模型 PanguLargeModels

NLP大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线