搜索_华为云

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

数据量和质量均满足要求，为什么盘古大模型微调效果不好这种情况可能是由于以下原因导致的，建议您排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合或过拟合。请检查训练参数中的 “训练轮次”或

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 ModelArts Studio大模型开发平台支持创建视频类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 视频类数据集格式要求文件内容文件格式文件要求视频 mp4或avi 支持mp4、avi视频格式上传，所有视频可以放在多个文件夹

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

同，回归分类数据不要求数据具有时间顺序。具体格式要求详见表1。表1 预测类数据集格式要求文件内容文件格式文件样例时序 csv 数据为结构化数据，包含列和行，每一行表示一条数据，每一列表示一个特征，并且必须包含预测目标列，预测目标列要求为连续型数据。目录下只有1个数据文件时，文件无命名要求。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

大模型支持设置人设，在用户调用文本对话（chat/completions）API时，可以将“role”参数设置为system，让模型按预设的人设风格回答问题。以下示例要求模型以幼儿园老师的风格回答问题： { "messages": [ { "role": "system"

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类
气象类数据集格式要求 - 盘古大模型 PanguLargeModels

对特定区域，旨在提供完整、一致且高精度的气象数据。再分析数据为二进制格式，具体格式要求详见表1。表1 气象类数据集格式要求文件内容文件格式文件样例气象-天气数据 nc、cdf、netcdf、gr、gr1、grb、grib、grb1、grib1、gr2、grb2、grib2

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 ModelArts Studio大模型开发平台支持创建图片类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 图片类数据集格式要求文件内容文件格式文件要求仅图片 tar、图片目录图片：支持jpg、jpeg、png、bmp类型。 ta

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。父主题：数据集格式要求

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
如何让大模型按指定风格或格式回复 - 盘古大模型 PanguLargeModels

解并捕捉预期风格。可以在提示词中，明确描述回复风格的要求。例如，若希望模型回答更精炼，可以提示：你的回复“需要简洁精炼”、“仅包括最重要的信息”或“专注于主要结论”。若希望模型输出遵循特定格式，可以在提示词中明确格式要求，或使用占位符和模板结构，让模型填充内容。例如：请按照以下格式输出：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 提示词工程类
数据集格式要求 - 盘古大模型 PanguLargeModels

数据集格式要求文本类数据集格式要求图片类数据集格式要求视频类数据集格式要求气象类数据集格式要求预测类数据集格式要求其他类数据集格式要求父主题：使用数据工程构建数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
考察模型逻辑 - 盘古大模型 PanguLargeModels

会认为用户反问是个新问题，而非多轮并回复“您并没有给我xxx问题，请给我具体的xxx问题，以便我更好地解答。” 复述任务要求可以让模型复述prompt中的要求，考察模型是否理解。比如“现在有一个xxx任务，我会给你xxx，你需要xxxx。\n\n现在你充分理解这个任务了吗？详细解释一遍，不用举例子/请举例说明。”

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

盘古科学计算大模型仅支持接入气象类数据集，该数据集格式要求请参见气象类数据集格式要求。训练科学计算大模型训练数据要求所需数据量构建科学计算大模型进行训练的数据要求见表1。表1 科学计算大模型训练数据要求模型类别特征要求水平分辨率要求区域范围要求时间要求数据获取方式气象/降水模型需包含4个表面层特征（10m

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
常见问题 - 盘古大模型 PanguLargeModels

Id> <version>[3.0.40-rc, 3.1.0)</version> </dependency> jackson版本要求请见pom.xml。使用java sdk出现json解析报错图1 json解析报错服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
准备工作 - 盘古大模型 PanguLargeModels

准备工作注册华为账号并开通华为云，并完成实名认证，账号不能处于欠费或冻结状态。检查开发环境要求，确认本地已具备开发环境。登录“我的凭证 > 访问密钥”页面，依据界面操作指引获取Access Key（AK）和Secret Access Key（SK）。下载的访问密钥为credentials

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等，不同训练方式所需要使用的数据见表1，该数据集格式要求请参见文本类数据集格式要求。表1 训练NLP大模型数据集类型要求基模型训练场景数据集类型数据集内容文件格式 NLP 预训练文本预训练文本 jsonl 微调文本

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

对任务进行补充说明，如补充任务要求、规范输出的格式等。将想要的逻辑梳理表达出来，会让生成效果更加符合预期。说明需要逻辑清晰、无歧义。设计任务要求要求分点列举：要求较多时需要分点列举，可以使用首先\然后，或1\2\3序号分点提出要求。每个要求步骤之间最好换行（\n）分隔断句，单个要求包含一项内容，不能太长。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

据质量评估，确保数据满足大模型训练的多样性、平衡性和代表性需求，促进数据的高效流通和应用。数据发布不仅包括将数据发布为适合使用的格式，还要求根据任务需求评估数据集效果，确保数据集在规模、质量和内容上符合模型训练的标准。数据评估平台预置了多种数据类型的基础评估标准，包括NLP

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
盘古推理SDK简介 - 盘古大模型 PanguLargeModels

息生成一个或多个预测的补全，还可以返回每个位置上不同词语的概率。它可以用来做文本生成、自动写作、代码补全等任务。开发环境要求华为云盘古大模型推理SDK要求： Java SDK适用于JDK 1.8及其以上版本。 Python SDK适用于Python3及以上版本。 Go SDK支持go

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

Studio大模型开发平台后，将生成“原始数据集”被平台统一管理，用于后续加工或发布操作。创建导入任务创建导入任务前，请先按照数据集格式要求提前准备数据。平台支持使用OBS服务导入数据，请详见通过控制台快速使用OBS。创建导入任务步骤如下：登录ModelArts Stud

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集

总条数： 71

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据量和质量均满足要求，为什么盘古大模型微调效果不好 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

气象类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

如何让大模型按指定风格或格式回复 - 盘古大模型 PanguLargeModels

数据集格式要求 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

考察模型逻辑 - 盘古大模型 PanguLargeModels

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

准备工作 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

盘古推理SDK简介 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线