搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

无监督领域知识数据量无法支持增量预训练，如何进行模型学习一般来说，建议采用增量预训练的方式让模型学习领域知识，但预训练对数据量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

针对不同的任务类型，所需数据量会所有不同。从经验上来说，对于简单的任务，数据量的要求会少一点，如3000到5000条；对于复杂的任务，需要的数据条数更大一些，如2万~10万条。在构造指令微调数据的成本可以接受的情况下，至少准备1万条以上指令微调数据为宜。数据质量要求：保证微调数据的正确性，多样性，复杂性。保

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

大模型支持设置人设，在用户调用文本对话（chat/completions）API时，可以将“role”参数设置为system，让模型按预设的人设风格回答问题。以下示例要求模型以幼儿园老师的风格回答问题： { "messages": [ { "role": "system"

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型使用类问题
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

状态回到开始节点状态。可通过调大对话轮数上限解决。 101047 初始化深度定制前后处理模块失败时触发该错误码。可检查护栏配置是否符合要求。 101048 执行深度定制用户回复改写（前处理）失败时触发该错误码。可检查前处理护栏代码。 101049 执行深度定制大模型生成的参

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
成长地图 - 盘古大模型 PanguLargeModels

如何调整训练参数，使盘古大模型效果最优？为什么微调后的盘古大模型的回答中会出现乱码？如何判断盘古大模型训练状态是否正常？数据量和质量均满足要求，为什么盘古大模型微调效果不好？更多提示词工程类如何利用提示词提高大模型在难度较高推理任务中的准确率？如何让大模型按指定风格或格式回复？

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

问题一：模型答案没有按照Prompt要求回答。例如，要求文案在300字以内，但是模型回答字数仍然超出300字。解决方案：在数据质量要求中提到要求训练数据的输出（target字段）需要符合业务场景需求。因此，针对该问题，需要严格控制数据质量。若输入（context字段）要求文案300字以内，则输出必须要满足300字以内。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
提示词写作常用方法论 - 盘古大模型 PanguLargeModels

对任务进行补充说明，如补充任务要求、规范输出的格式等。将想要的逻辑你梳理表达出来，会让生成效果更加符合预期。说明需要逻辑清晰、无歧义。设计任务要求要求分点列举：要求较多时需要分点列举，可以使用首先\然后，或1\2\3序号分点提出要求。每个要求步骤之间最好换行（\n）分隔断句，单个要求包含一项内容，不能太长。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。 Verification failed. Please check the content format is consistent with the template requirements. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
准备工作 - 盘古大模型 PanguLargeModels

准备工作注册华为账号并开通华为云，并完成实名认证，账号不能处于欠费或冻结状态。检查开发环境要求，确认本地已具备开发环境。登录“我的凭证 > 访问密钥”页面，依据界面操作指引获取Access Key（AK）和Secret Access Key（SK）。下载的访问密钥为credentials

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
约束与限制 - 盘古大模型 PanguLargeModels

使用限制数据工程-数据格式要求 ModelArts Studio平台支持接入的数据需要满足格式要求，包括文件格式、单个文件大小、所有文本大小以及文件数量等，请参考《用户指南》“使用数据工程构建数据集 > 数据集格式要求”。模型开发-训练、评测最小数据量要求使用ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
盘古推理SDK简介 - 盘古大模型 PanguLargeModels

息生成一个或多个预测的补全，还可以返回每个位置上不同词语的概率。它可以用来做文本生成、自动写作、代码补全等任务。开发环境要求华为云盘古大模型推理SDK要求： Java SDK适用于JDK 1.8及其以上版本。 Python SDK适用于Python3及以上版本。 Go SDK支持go

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

Studio大模型开发平台后，将生成“原始数据集”被平台统一管理，用于后续加工或发布操作。创建导入任务创建导入任务前，请先按照数据集格式要求提前准备数据。平台支持使用OBS服务导入数据，请详见通过控制台快速使用OBS。创建导入任务步骤如下：登录ModelArts Studio大模型开发平台，单击进入操作空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
状态码 - 盘古大模型 PanguLargeModels

Acceptable 服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证，与401类似，但请求者应当使用代理进行授权。 408 Request Timeout 服务器等待请求发生超时。客户端可以随时再次提交该请求而无需进行任何更改。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
标注图片类数据集 - 盘古大模型 PanguLargeModels

启用时，可以指定参与标注的人员及标注数量。标注要求选择标注项为“图片Caption”且开启AI预标注功能时，可设置以下两种方式的“标注要求”：选择“全部标注”：要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。选择“可部分标注”：允许标注人员在确认AI预标注满足要求后，直接使用AI预标注功能完成数据集的标注并提交标注结果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工图片类数据集
管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

如果您需要为企业员工设置不同的访问权限，以实现功能使用权限和资产的权限隔离，可以为不同员工配置相应的角色，以确保资产的安全和管理的高效性。如果华为云账号已经能满足您的要求，不需要创建独立的IAM用户（子用户）进行权限管理，您可以跳过本章节，不影响您使用盘古的其他功能。您可以使用统一身份认证服务（IAM）并结合ModelArts

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作 > 创建并管理盘古工作空间
常见问题 - 盘古大模型 PanguLargeModels

Id> <version>[3.0.40-rc, 3.1.0)</version> </dependency> jackson版本要求请见pom.xml。使用java sdk出现json解析报错图1 json解析报错服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
明确任务需求 - 盘古大模型 PanguLargeModels

明确任务需求需要站在模型的角度理解相关任务的真实底层任务，并清晰描述任务要求。例如，在文档问答任务中，任务本质不是生成，而是抽取任务，需要让模型“从文档中抽取出问题的答案，不能是主观的理解或解释，不能修改原文的任何符号、字词和格式”，如果使用“请阅读上述文档，并生成以下问题

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 提示词写作进阶技巧
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

的比例组合，确保数据满足大模型训练的多样性、平衡性和代表性需求，促进数据的高效流通和应用。数据发布不仅包括将数据发布为适合使用的格式，还要求根据任务需求评估数据集效果，并科学调整数据比例，确保数据集在规模、质量和内容上符合模型训练的标准。数据评估平台预置了多种数据类型的基础

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
标注视频类数据集 - 盘古大模型 PanguLargeModels

启用时，可以指定参与标注的人员及标注数量。标注要求选择标注项为“视频Caption”且开启AI预标注功能时，可设置以下两种方式的“标注要求”：选择“全部标注”：要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。选择“可部分标注”：允许标注人员在确认AI预标注满足要求后，直接使用AI预标注功能完成数据集的标注并提交标注结果。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建数据集数据工程介绍数据工程使用流程数据集格式要求导入数据至盘古平台加工数据集发布数据集数据工程常见报错与解决方案

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南

总条数： 57

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

盘古大模型是否可以自定义人设 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

打造短视频营销文案创作助手 - 盘古大模型 PanguLargeModels

提示词写作常用方法论 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

准备工作 - 盘古大模型 PanguLargeModels

约束与限制 - 盘古大模型 PanguLargeModels

盘古推理SDK简介 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

标注图片类数据集 - 盘古大模型 PanguLargeModels

管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

明确任务需求 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建数据集 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线