盘古大模型 PANGULARGEMODELS-华为云

盘古大模型 PANGULARGEMODELS-最新动态:2024年9月

2024年9月序号功能名称功能描述阶段相关文档 1 盘古大模型正式公测上线盘古大模型是集数据管理、模型训练和模型部署于一体的一站式大模型开发与应用平台。平台支持大模型的定制开发，提供全生命周期工具链，帮助开发者高效构建与部署模型，企业可灵活选择适合的服务与产品，轻松实现模型与应用的开发。公测产品介绍 2 盘古大模型「应用百宝箱」上线应用百宝箱是盘古大模型为用户提供的便捷AI应用集，首批支持14个开箱即用的大模型应用。用户可在其中使用盘古大模型预置的场景应用和外部应用，轻松体验大模型开箱即用的强大能力。公测体验盘古驱动的应用百宝箱 3 盘古大模型「能力调测」功能上线为用户提供了文本补全和多轮对话两种能力，用户可通过自定义参数，深入体验盘古预置模型的能力。公测体验盘古预置模型能力

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-大模型是否可以自定义人设

大模型是否可以自定义人设大模型支持设置人设，在用户调用对话问答（chat/completions）API时，可以将“role”参数设置为system，让模型按预设的人设风格回答问题。例如，以下示例要求模型以幼儿园老师的风格回答问题。 { "messages": [ { "role": "system", "content": "请用幼儿园老师的口吻回答问题，注意语气温和亲切，通过提问、引导、赞美等方式，激发学生的思维和想象力。" }, { "role": "user", "content": "介绍下长江，以及长江中典型的鱼类" } ], "temperature": 0.9, "max_tokens": 600 } 父主题：大模型概念类问题

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-数据量足够，但质量较差，可以微调吗

数据量足够，但质量较差，可以微调吗对于微调而言，数据质量非常重要。一份数据量少但质量高的数据，对于模型效果的提升要远大于一份数据量多但质量低的数据。若微调数据的质量较差，那么可能会导致模型学习到一些错误或者不完整的信息，从而影响模型的准确性和可靠性。因此，不建议您直接使用低质量数据进行微调。一份高质量的数据应具备以下几类特征：数据与目标任务一致：微调数据应该与微调任务的目标和分布保持一致，反映出任务的实际要求。比如，现在需要微调一个情感分类的模型，模型只需要回复“消极”或者“积极”：情感分类场景-典型低质量数据：数据中存在与目标任务不一致的样本。 {"context": ["请分析以下内容的情感，只回复积极或者消极\n内容：xxx], "target": "积极"} {"context": ["请分析以下内容的情感，只回复积极或者消极\n内容：xxx], "target": "消极"} {"context": ["请分析以下内容的情感，只回复积极或者消极\n内容：xxx], "target": "这段内容xxx"} {"context": ["请分析以下内容的情感，回复你的看法\n内容：xxx], "target": "这段内容xxx"} …… 情感分类场景-较高质量数据：数据指向性明确。 {"context": ["请分析以下内容的情感，回复积极或者消极\n内容：xxx], "target": "积极"} {"context": ["请分析以下内容的情感，回复积极或者消极\n内容：xxx], "target": "消极"} …… 数据中无异常样本：微调数据需要清洗和校验，滤除其中的噪声，尽可能保证回答中不存在异常数据。如空数据、重复、水印和异常字符等。数据多样性：微调数据需要具有一定的多样性，多样性能增加任务的复杂度和难度，让模型能够处理不同的情况和问题，提升模型泛化性。例如，现在需要微调一个文案创作的模型，模型需要生成各个城市的宣传文案：文案创作场景-典型低质量数据：数据多样性差。 {"context": ["请帮我写一份宣传文案"], "target": "北京，xxx"} {"context": ["请帮我写一份宣传文案"], "target": "上海，xxx "} {"context": ["请帮我写一份宣传文案"], "target": "广州，xxx "} {"context": ["请帮我写一份宣传文案"], "target": "深圳，xxx "} …… 文案创作场景-较高质量数据：数据有一定多样性。 {"context": ["请帮我写一份宣传文案介绍北京"], "target": "北京，xxx"} {"context": ["现在需要你写一份文案来宣传上海"], "target": "上海，xxx "} {"context": ["广州市需要一份推广文案，请开始创作"], "target": "广州，xxx "} {"context": ["你是一名导游，现在请向我介绍下深圳这座城市"], "target": "深圳，xxx "} …… 若目标任务是相对明确的，则在微调数据中，每个任务的Prompt可以保持固定。注意，这里Prompt保持固定和保证数据多样性，二者并不冲突。当然，如果您的数据质量较差，也可以采取一些方法来提升数据质量，比如：数据清洗：您可以通过一些简单基础的规则逻辑来过滤异常数据，比如，去空、去重、字符串过滤等。同时，您也可以采用PPL（困惑度），或训练一个二分类模型等方式过滤脏数据。数据增强：您可以通过一些规则来提升数据的多样性，比如：同义词替换、语法结构修改、标点符号替换等，保证数据的多样性。基于大模型的数据泛化：您可以通过调用大模型（比如盘古提供的任意一个规格的基础功能模型）来获取目标场景的数据，以此提升数据质量。一个比较常见的方法是，将微调数据以及数据评估标准输入给模型，让模型来评估数据的优劣。人工标注：如果以上两种方案均无法满足您的要求，您也可以使用“数据标注”功能，采用人工标注方式来清洗数据。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-如何判断训练状态是否正常

如何判断训练状态是否正常判断训练状态是否正常，通常可以通过观察训练过程中Loss（损失函数值）的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标，正常情况下越小越好。您可以从平台的训练日志中获取到每一步的Loss，并绘制成Loss曲线，来观察其变化趋势。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的进行，Loss值不断减小，直到收敛到一个较小的值。以下给出了几种正常的Loss曲线形式：图1 正常的Loss曲线：平滑下降图2 正常的Loss曲线：阶梯下降如果您发现Loss曲线出现了以下几种情况，可能意味着模型训练状态不正常： Loss曲线上升：Loss上升的原因可能是由于数据质量差，或者学习率设置得过大，使得模型在最优解附近震荡，甚至跳过最优解，导致无法收敛。您可以尝试提升数据质量或者减小学习率的方式来解决。图3 异常的Loss曲线：上升 Loss曲线平缓，保持高位：Loss保持平缓且保持高位不下降的原因可能是由于目标任务的难度较大，或者模型的学习率设置得过小，导致模型的收敛速度太慢，无法达到最优解。您可以尝试增大训练轮数或者增大学习率的方式来解决。图4 异常的Loss曲线：平缓且保持高位 Loss曲线异常抖动：Loss曲线异常抖动的原因可能是由于训练数据质量差，比如数据存在噪声或者分布不均衡，导致训练过程不稳定。你可以尝试提升数据质量的方式来解决。图5 异常的Loss曲线：异常抖动父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-为什么微调后的模型，评估结果很好，但实际场景表现却很差

为什么微调后的模型，评估结果很好，但实际场景表现却很差当您在微调过程中，发现模型评估的结果很好，一旦将微调的模型部署以后，输入一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。此外，若可预见实际场景会不断发生变化，建议您定期更新训练数据，对模型进行微调更新。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-为什么微调后的模型，回答会异常中断

为什么微调后的模型，回答会异常中断当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果不完整，出现了异常截断。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“最大Token限制”参数的设置，适当增加该参数的值，可以增大模型回答生成的长度，避免生成异常截断。请注意，该参数值存在上限，请结合目标任务的实际需要以及模型支持的长度限制来调整。模型规格：不同规格的模型支持的长度不同，若目标任务本身需要生成的长度已经超过模型上限，建议您替换可支持更长长度的模型。数据质量：请检查训练数据中是否存在包含异常截断的数据，可以通过规则进行清洗。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-为什么微调后的模型，回答总是在重复某一句或某几句话

为什么微调后的模型，回答总是在重复某一句或某几句话当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成了复读机式的结果，即回答中反复出现某一句话或某几句话。这种情况可能是由于以下几个原因导致的，建议您依次排查：推理参数设置：请检查推理参数中的“话题重复度控制”或“温度”或“核采样”等参数的设置，适当增大其中一个参数的值，可以提升模型回答的多样性。数据质量：请检查训练数据中是否存在文本重复的异常数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-训练智能客服系统大模型需要考虑哪些方面

训练智能客服系统大模型需要考虑哪些方面根据智能客服场景，建议从以下方面考虑：根据企业实际服务的场景和积累的数据量，评估是否需要构建行业模型，如电商、金融等。根据每个客户的金牌客服话术，可以对对话模型进行有监督微调，进一步优化其性能。根据每个客户的实际对话知识，如帮助文档、案例库和FAQ库等，可以使用“先搜后推”的解决方案。客户的文档库可以实时更新，大模型的应答可以无缝实时更新。（搜索+大模型解决方案）父主题：大模型概念类问题

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-大模型的安全性需要从哪些方面展开评估和防护

大模型的安全性需要从哪些方面展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、审计和数据主权保护等机制。在训练和推理过程中，通过数据脱敏、隐私计算等技术手段识别并保护敏感数据，有效防止隐私泄露，保障个人隐私数据安全。内容安全：通过预训练和强化学习价值观提示（prompt），构建正向的意识形态。通过内容审核模块过滤违法及违背社会道德的有害信息。模型安全：通过模型动态混淆技术，使模型在运行过程中保持混淆状态，有效防止结构信息和权重信息在被窃取后暴露。系统安全：通过网络隔离、身份认证和鉴权、Web安全等技术保护大模型系统安全，增强自身防护能力，以抵御外部安全攻击。父主题：大模型概念类问题

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-盘古自然语言大模型的适用场景有哪些

盘古自然语言大模型的适用场景有哪些自然语言处理大模型是一种参数量极大的预训练模型，是众多自然语言处理下游任务的基础模型。学术界和工业界的实践证明，随着模型参数规模的增加，自然语言处理下游任务的效果显著提升，这得益于海量数据、大量算力以及深度学习的飞跃发展。基于自然语言处理大模型的预训练模型，可以根据业务需求开发出诸如营销文案生成、阅读理解、智能对话和代码生成等应用功能。父主题：大模型概念类问题

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同当您将微调的模型部署以后，输入一个已经出现在训练样本中，或虽未出现但和训练样本差异很小的问题，回答完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当增大“训练轮次”的值，或根据实际情况调整“学习率”的值，帮助模型更好收敛。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，则会加剧该现象。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好

数据量和质量均满足要求，Loss也正常收敛，为什么微调后的效果不好这种情况可能是由于以下几个原因导致的，建议您依次排查： Prompt设置：请检查您使用的Prompt，对于同一个目标任务，建议在推理阶段使用和训练数据相同或相似的PROMPT，才能发挥出模型的最佳效果。模型规格：理论上模型的参数规模越大，模型能学到的知识就越多，能学会的知识就更难，若目标任务本身难度较大，建议您替换参数规模更大的模型。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-如何评估微调后的模型是否正常

如何评估微调后的模型是否正常评估模型效果的方法有很多，通常可以从以下几个方面来评估模型训练效果： Loss曲线：通过Loss曲线的变化趋势来评估训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。人工评测：您可以采用人工评测的方式，参照目标任务构造评测集，通过横向或纵向评估评测集的方式来验证模型效果。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-为什么微调后的模型，回答中会出现乱码

为什么微调后的模型，回答中会出现乱码当您将微调的模型部署以后，输入一个与目标任务同属的问题，模型生成的结果中出现了其他语言、异常符号、乱码等字符。这种情况可能是由于以下几个原因导致的，建议您依次排查：数据质量：请检查训练数据中是否存在包含异常字符的数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。推理参数设置：请检查推理参数中的“温度”或“核采样”等参数的设置，适当减小其中一个参数的值，可以提升模型回答的确定性，避免生成异常内容。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

盘古大模型 PANGULARGEMODELS-为什么微调后的模型，只能回答在训练样本中学过的问题

为什么微调后的模型，只能回答在训练样本中学过的问题当您将微调的模型部署以后，输入一个已经出现在训练样本中的问题，模型生成的结果很好，一旦输入了一个从未出现过的数据（目标任务相同），回答却完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。数据质量：请检查训练数据的质量，若训练样本出现了大量重复数据，或者数据多样性很差，则会加剧该现象。父主题：典型训练问题和优化策略

盘古大模型 PANGULARGEMODELS

云服务器内容精选

盘古大模型 PANGULARGEMODELS

7*24

备案

专业服务

退订

建议反馈

售前咨询热线