搜索_华为云

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

如何对盘古大模型的安全性展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类
为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差当您在微调过程中，发现模型评估的结果很好，一旦将微调的模型部署以后，输入一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常评估模型效果的方法有很多，通常可以从以下几个方面来评估模型训练效果： Loss曲线：通过Loss曲线的变化趋势来评估训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

目录下有多个数据文件时，需要通过命名的方式指定数据是训练数据集、验证数据集还是测试数据集。训练数据名称需包含train字样，如train01.csv；验证数据名称需包含eval字样；测试数据名称需包含test字样。文件的命名不能同时包含train、eval和test中的两个或三个。时序预测必

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

温度主要用于控制模型输出的随机性和创造性。温度越高，输出的随机性和创造性越高；温度越低，输出结果越可以被预测，确定性相对也就越高。您可根据真实的任务类型进行调整。一般来说，如果目标任务的需要生成更具创造性的内容，可以使用较高的温度，反之如果目标任务的需要生成更为确定的内容，可以使用较低的温度。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
效果评估与优化 - 盘古大模型 PanguLargeModels

输出“大模型”节点的回答。图2 试运行工作流-2 多场景测试：对多种不同场景下的prompt进行测试，确保在各种情境下系统能够有效响应：不同语言对的翻译：如图3，针对不同的语言对（如中文到法语、俄语到西班牙语），评估翻译效果是否稳定。图3 多场景测试-不同语言对复杂对话

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

标准格式：适用于广泛的数据使用场景，满足大多数模型训练的标准需求。该格式的数据集将发布到资产中，但下游模型开发不可见。盘古格式：专为盘古大模型训练设计的格式，确保数据集在盘古模型训练中的兼容性和一致性。该格式的数据集将被用于ModelArts Studio大模型开发平台的模型开发功能使用。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
视频类数据集格式要求 - 盘古大模型 PanguLargeModels

数据源样本为avi、mp4格式，标注文件为json格式。必须包含两个及以上后缀名字为avi或者mp4的文件。每个视频时长要大于128s，FPS>=10，且测试集训练集都要有视频。支持视频的格式包括常见的mp4/avi格式文件，每个视频时长要大于128s，FPS>=10，用annotation

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

Models）通常指的是具有海量参数和复杂结构的深度学习模型，广泛应用于自然语言处理（NLP）等领域。开发一个大模型的流程可以分为以下几个主要步骤：数据集准备：大模型的性能往往依赖于大量的训练数据。因此，数据集准备是模型开发的第一步。首先，需要根据业务需求收集相关的原始数据，确保数据的覆盖面和多样性。例如

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
优化推理超参数 - 盘古大模型 PanguLargeModels

温度主要用于控制模型输出的随机性和创造性。温度越高，输出的随机性和创造性越高；温度越低，输出结果越可以被预测，确定性相对也就越高。您可根据真实的任务类型进行调整。一般来说，如果目标任务的需要生成更具创造性的内容，可以使用较高的温度，反之如果目标任务的需要生成更为确定的内容，可以使用较低的温度。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
管理知识库 - 盘古大模型 PanguLargeModels

管理知识库 Agent开发平台支持对知识库执行获取知识库ID、删除、命中测试操作。新增、删除知识库中知识文档登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。在左侧导航栏中选择“Agent开发”，跳转至Agent开发平台。进入“工作台

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
微调典型问题 - 盘古大模型 PanguLargeModels

模型在测试集上表现不佳，泛化能力差。通过统计学方法如计算四分位距、Z-score、样本分布等排查异常值。通过可视化方法，数据可视化或者使用箱线图进行异常值的排查。结合数据自身特征，进行异常数据的筛选。对于异常值，视情况进行删除、替换、保留等操作，兼顾模型的收敛与鲁棒性。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型训练实践 > 盘古科学计算大模型微调训练实践
数据预处理优化 - 盘古大模型 PanguLargeModels

顾模型的收敛与鲁棒性。优化举例：某数据集中，盐度（S）变量在下载过程中存在数据块缺失与数据块偏移的问题，如图1、图2，导致在训练过程中盐度损失异常，波动大且不收敛，如图3。在删除异常数据后，如图4，盐度正常收敛。因此在训练过程中存在损失波动较大的情况，可以考虑数据异常的情况。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
文本类加工算子介绍 - 盘古大模型 PanguLargeModels

示例如下：去除“参考文献”以及之后的内容：\n参考文献[\s\S]* 针对pdf的内容，去除“0 引言”之前的内容，引言之前的内容与知识无关：[\s\S]{0，10000}0 引言针对pdf的内容，去除“1.1Java简介”之前的与知识无关的内容：[\s\S]{0，10000}

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
概述 - 盘古大模型 PanguLargeModels

概述盘古大模型整合华为云强大的计算和数据资源，将先进的AI算法集成在预训练大模型中，打造出具有深度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。盘古大模型在ModelArts Studio大模型开发平台部署后，可以通过API调用推理接口。表1 API清单

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
创建知识库 - 盘古大模型 PanguLargeModels

知识库命中测试平台支持对创建的知识库进行命中测试，以评估知识库的效果和准确性。命中测试通过将用户的查询与知识库中的内容进行匹配，最终输出与查询相关的信息，并根据匹配的程度进行排序。知识库命中测试步骤如下：登录ModelArts Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
图片类加工算子介绍 - 盘古大模型 PanguLargeModels

过滤文本长度不在“文本长度范围”内的图文对。一个中文汉字或一个英文字母，文本长度均计数为1。图文文本语言过滤通过语种识别模型得到图文对的文本语种类型，“待保留语种”之外的图文对数据将被过滤。图文去重基于结构化图片去重判断相同文本对应不同的图片数据是否超过阈值，如果超过则去重。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
调优典型问题 - 盘古大模型 PanguLargeModels

删除异常值后，盐度（S）损失收敛正常，如图4。表2 验证集选择的时间区段时间分辨率推理步数验证集选择的时间区段（需要至少在以下时间点内，且有连续数据，才能得到1条测试数据。） 1h 24 24h内每1h的数据（例：0点，1点，2点…次日0点）。 3h 12 36h内每3h的数据（例：0点，3点， 6点…次日9点，次日12点）。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古科学计算大模型调优实践
调优典型问题 - 盘古大模型 PanguLargeModels

任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 模型调优实践 > 盘古NLP大模型调优实践
手动编排应用 - 盘古大模型 PanguLargeModels

用于配置大模型的输出多样性。包含取值：精确的：模型的输出内容严格遵循指令要求，可能会反复讨论某个主题，或频繁出现相同词汇。平衡的：平衡模型输出的随机性和准确性。创意性的：模型输出内容更具多样性和创新性，某些场景下可能会偏离主旨。自定义：自定义大模型输出的温度和核采样值，生成符合预期的输出。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用

总条数： 90

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何对盘古大模型的安全性展开评估和防护 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型评估结果很好，但实际场景表现很差 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

效果评估与优化 - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

视频类数据集格式要求 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

优化推理超参数 - 盘古大模型 PanguLargeModels

管理知识库 - 盘古大模型 PanguLargeModels

微调典型问题 - 盘古大模型 PanguLargeModels

数据预处理优化 - 盘古大模型 PanguLargeModels

文本类加工算子介绍 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

创建知识库 - 盘古大模型 PanguLargeModels

图片类加工算子介绍 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

调优典型问题 - 盘古大模型 PanguLargeModels

手动编排应用 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线