搜索_华为云

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

支持mp4、avi视频格式上传，所有视频可以放在多个文件夹下，每个文件夹下可以同时包含mp4或avi格式的视频。单个文件大小不超过50GB，文件数量最多1000个。事件检测视频+json 数据源样本为avi、mp4格式，标注文件为json格式。必须包含两个及以上后缀名字为avi或者mp4的文件。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。网页 html 单个文件大小不超过50GB，文件数量最多1000个。预训练文本 jsonl jsonl格式：text表示预训练所使用的文本数据，具体格式示例如下：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

≥ 1万条/每场景 4K版本：4096 32K版本：32768 评测NLP大模型所需数据量要求所有文本大小最大不超过100MB，目录下文件数量最多不超过100个。数据条数范围为：3-1000条。构建NLP大模型数据集流程在ModelArts Studio大模型开发平台中，使用

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

和丰富度等等。当前，平台支持的推理参数包括：温度、核采样以及话题重复度控制，如下提供了这些推理参数的建议值和说明，供您参考：表1 推理参数的建议和说明推理参数范围建议值说明温度（temperature） 0~1 0.3 温度主要用于控制模型输出的随机性和创造性。温度

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用盘古NLP大模型创建Python编码助手应用 - 盘古大模型 PanguLargeModels

“Prompt优化”窗口中单击“确定”。步骤3：添加预置插件应用支持添加插件技能，可添加“预置插件”和“个人插件”。添加插件可以为应用配备更多技能，建议插件数量不超过5个。本节示例将指导您添加名为python_interpreter的“预置插件”。添加插件的步骤如下：在“技能 > 插件”模块，单击“添加”。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格：理论上模型的参数规模越大，模型能学到的知识就越多，能学会的知识就更难，若目标任务本身难度较大，建议您替换参数规模更大的模型。父主题：大模型微调训练类问题

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
编排应用 - 盘古大模型 PanguLargeModels

图3 Prompt优化示例步骤3：添加插件应用支持添加插件技能，可添加“预置插件”和“个人插件”。添加插件可以为应用配备更多技能，建议插件数量不超过5个。如果需要添加“个人插件”，请确保已完成创建插件操作。添加插件的步骤如下：在“技能 > 插件”模块，单击“添加”。在

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
基本概念 - 盘古大模型 PanguLargeModels

用户注册华为云时的账号，账号对其所拥有的资源及云服务具有完全的访问权限，可以重置用户密码、分配用户权限等。由于账号是付费主体，为了确保账号安全，建议您不要直接使用账号进行日常管理工作，而是创建用户并使用他们进行日常管理工作。用户由账号在IAM中创建的用户，是云服务的使用人员，具有身份凭证（密码和访问密钥）。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

为什么多轮问答场景的盘古大模型微调效果不好当您的目标任务是多轮问答，并且使用了多轮问答数据进行微调，微调后却发现多轮回答的效果不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据格式：多轮问答场景需要按照指定的数据格式来构造，问题需要拼接上历史所有轮对话的问题和回答。比如，当前是第三轮对话，数据中

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

upper_air_features：高空特征变量列表，例如湿度（Q）、温度（T）、风速（U、V）、高度（Z）。单个文件大小不超过50GB，文件数量最多1000个。气象-海洋数据 nc、cdf、netcdf、gr、gr1、grb、grib、grb1、grib1、gr2、grb2、grib2

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

12:03:00,10.8,20.9,103 2024-05-27 12:04:00,10.9,21.0,104 单个文件大小不超过50GB，文件数量最多1000个。回归分类 csv 数据为结构化数据，包含列和行，每一行表示一条数据，每一列表示一个特征，并且必须包含预测目标列，预测目标列要求为连续型数据。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
标注视频类数据集 - 盘古大模型 PanguLargeModels

标注分配与审核配置参数类型参数名称参数说明标注分配启用多人标注关闭时，默认管理员单人标注。启用时，可以指定参与标注的人员及标注数量。标注要求选择标注项为“视频Caption”且开启AI预标注功能时，可设置以下两种方式的“标注要求”：选择“全部标注”：要求标注人员

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
状态码 - 盘古大模型 PanguLargeModels

多的事情，因为该请求被设置为拒绝访问，建议直接修改该请求，不要重试该请求。 404 Not Fou 所请求的资源不存在。建议直接修改该请求，不要重试该请求。 405 Method Not Allowed 请求中带有该资源不支持的方法。建议直接修改该请求，不要重试该请求。 406

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

用来识别最可能导致特定天气或气候事件的初始条件，还可以用来评估预报结果的不确定性。初始扰动数量用于选择集合预报的CNOP初始扰动数量。在CNOP的加噪方式中，会先对初始场进行一定数量的加噪得到一组加噪后的初始场，然后从这组初始场中选择能量变化最大的初始场作为集合预报的初始场，启动推理作业。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 调用科学计算大模型
查看CV大模型训练状态与指标 - 盘古大模型 PanguLargeModels

平均交并比平均交并比是所有类别的交并比的平均值。数值越高，表明模型在所有类别上的性能越好。像素精度像素精度表示模型正确分类的像素数量占总像素数量的比例。数值越高，表明模型性能越好。精准率精准率是指在模型预测为正类的样本中，真正类样本的比例。数值越高，表明模型在检测正类样本时的准确性越高。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型
配比图片类数据集 - 盘古大模型 PanguLargeModels

数据配比”，单击界面右上角“创建配比任务”。在“数据集选择”页签选择需要配比的文本类数据集（至少选择两个），单击“下一步”。在“数据配比”页面，可以设置不同数据集的配比数量，单击“确定”。页面将返回至“数据配比”页面，配比任务运行成功后，状态将显示为“运行成功”。单击操作列“生成”，将生成“发布数据集”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

保证数据的覆盖度：数据需要尽可能覆盖产品所提供的功能；数据需要覆盖难易度、长短度，包含参数丰富等场景；数据在长短、扁平与深层嵌套、对接客户api接口数量上全覆盖。数据中需要提供JSON的字段解释，以及Query和JSON生成逻辑解释。这些信息需要拼入Prompt，并确保人以及大模型可以根

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、案

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
CV大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

训练集中的标签个数与验证集中的个数不一致，导致该错误发生。例如，训练集中的标签共有4个，验证集中的标签只有3个。请保持数据中训练集和验证集的标签数量一致。父主题：训练CV大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古CV大模型 > 训练CV大模型

总条数： 72

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

使用盘古NLP大模型创建Python编码助手应用 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

编排应用 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

为什么多轮问答场景的盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

使用“能力调测”调用科学计算大模型 - 盘古大模型 PanguLargeModels

查看CV大模型训练状态与指标 - 盘古大模型 PanguLargeModels

配比图片类数据集 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

训练智能客服系统大模型需考虑哪些方面 - 盘古大模型 PanguLargeModels

CV大模型训练常见报错与解决方案 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线