搜索_华为云

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

回答却完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了过拟合。请检查训练参数中的 “训练轮次”或“学习率”等参数的设置，适当降低这些参数的值，降低过拟合的风险。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

题，回答完全错误。这种情况可能是由于以下几个原因导致的，建议您依次排查：训练参数设置：您可以通过绘制Loss曲线查询来确认模型的训练过程是否出现了问题，这种情况大概率是由于训练参数设置的不合理而导致了欠拟合，模型没有学到任何知识。请检查训练参数中的 “训练轮次”或“学习率”等参

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

推理参数设置：请检查推理参数中的“话题重复度控制”或“温度”或“核采样”等参数的设置，适当增大其中一个参数的值，可以提升模型回答的多样性。数据质量：请检查训练数据中是否存在文本重复的异常数据，可以通过规则进行清洗。训练参数设置：若数据质量存在问题，且因训练参数设置的不合理而导致过拟合，该现象会更加明显。请检查训练参数中的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
Cache - 盘古大模型 PanguLargeModels

cache.update("缓存是否存在？",LLMResp.builder().answer("存在。").build()); //校验，一致 //用于检查缓存中的数据是否与查询的数据是否一致，如果一致，就返回缓存中的结果对象 //例如，查询“缓存是否存在？”这个问题和“test

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Memory（记忆）
Cache - 盘古大模型 PanguLargeModels

用于检查缓存中的数据是否与查询的数据是否一致，如果一致，就返回缓存中的结果对象 # 例如，查询“缓存是否存在？”这个问题和“test-semantic-cache-vector-001”这个会话标识，就可以从缓存中获取到之前保存的答案“存在” query = "缓存是否存在？" cache_value_after

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Memory（记忆）
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

步骤4.综合以上内容和json格式，输出json 微调数据清洗：如下提供了该场景实际使用的数清洗策略，供您参考：判断数据中的JSON结构是否符合预先定义的接口结构。异常数据示例如下： {"context": "…", "target": "{\"metrics\":['AvgProfits'

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
LLMs（语言模型） - 盘古大模型 PanguLargeModels

# 核采样值，和temperature不同时配置 presence_penalty: Optional[float] # 存在惩罚，增加模型谈论新主题的可能性，范围见具体模型API规范 frequency_penalty: Optional[float] # 频率惩罚，降

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK
运行Agent - 盘古大模型 PanguLargeModels

运行Agent 单轮执行调用run接口运行一个Agent： agent.run("帮我定个下午3点到8点2303会议室") Agent的运行时会进行自我迭代，并且选择合适的工具，在日志中打印最终的执行结果：用户: 帮我定个下午3点到8点2303会议室助手: 好的，2023-11-17

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Agent（智能代理）
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

{"context ": ["用微波炉热汤要盖盖子吗？判断以上问题是否需要调用检索，请回答“是”或”否“"], "target": "否"} {"context ": ["福田区支持哪些组织开展退役军人教育培训工作？判断以上问题是否需要调用检索，请回答“是”或”否“"], "target

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
LLMs（语言模型） - 盘古大模型 PanguLargeModels

// 核采样值，和temperature不同时配置 private double presencePenalty; // 存在惩罚，增加模型谈论新主题的可能性 private double frequencyPenalty; // 频率惩罚，降低模型重复的可能性，提高文本多样性、创造型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK
数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

数据中无异常样本：微调数据需要清洗和校验，滤除其中的噪声，尽可能保证回答中不存在异常数据。如空数据、重复、水印和异常字符等。数据多样性：微调数据需要具有一定的多样性，多样性能增加任务的复杂度和难度，让模型能够处理不同的情况和问题，提升模型泛化性。例如，现在需要微调一个文案创作的模型，模型需要生成各个城市的宣传文案：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建数据集清洗任务 - 盘古大模型 PanguLargeModels

能查看算子对数据的清洗效果。算子功能的详细介绍请参见清洗算子功能介绍。图3 执行节点用户配置算子后推荐增加、显示备注信息，用于团队其他成员快速了解算子编排。图4 增加并显示备注信息对于搭建满意的清洗流程，可以“发布模板”，后续重复使用。发布后的模板，可以在“模板”页签查看，也可以返回数据清洗列表，在“清洗模板

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集 > 清洗数据集（可选）
打基础 - 盘古大模型 PanguLargeModels

打基础先制定一个能够明确表达主题的提示词（若模型训练时包含相似任务，可参考模型训练使用的提示词），再由简至繁，逐步增加细节和说明。打好基础是后续提示词优化的前提，基础提示词生成效果差，优化只会事倍功半。例如，文学创作类可以使用“请创作一个关于{故事主题}的故事”，邮件写作类可

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 常用方法论
盘古自然语言大模型的适用场景有哪些 - 盘古大模型 PanguLargeModels

盘古自然语言大模型的适用场景有哪些自然语言处理大模型是一种参数量极大的预训练模型，是众多自然语言处理下游任务的基础模型。学术界和工业界的实践证明，随着模型参数规模的增加，自然语言处理下游任务的效果显著提升，这得益于海量数据、大量算力以及深度学习的飞跃发展。基于自然语言处理大模型的预训练模型，可以根据业务

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
盘古大模型-成长地图 - 盘古大模型 PanguLargeModels

大模型的计量单位token指的是什么？大模型是否可以自定义人设？盘古自然语言大模型的适用场景有哪些？大模型的安全性需要从哪些方面展开评估和防护？训练智能客服系统大模型需要考虑哪些方面？更多模型训练类如何调整训练参数，使模型效果最优？如何判断训练状态是否正常？更多数据集类数据量很少，可以微调吗？

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
撰写提示词 - 盘古大模型 PanguLargeModels

等。撰写提示词时，可以设置提示词变量，即在提示词中通过添加占位符{{ }}标识，表示一些动态的信息，让模型根据不同的情况生成不同的文本，增加模型的灵活性和适应性。例如，将提示词设置为“你是一个旅游助手，需要给用户介绍旅行地的风土人情。请介绍一下{{location}}的风土人情

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 撰写提示词
检测数据集质量 - 盘古大模型 PanguLargeModels

↓ ↕ ► ◄ 表情符号校验校验数据中是否存在表情符号，如 ⛪ 璉等，常见表情符清单请参见Full Emoji List。空值校验校验数据中是否存在空字符串。异常格式校验检查数据是否满足数据格式要求。冗余换行符校验检查数据中是否存在连续两个及以上的换行符。表2 健康度状态说明

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
Agent助手 - 盘古大模型 PanguLargeModels

"meeting_room_status_query", toolDesc = "查询会议室的状态，是否被预定或者正在使用中", toolPrinciple = "请在需要预定会议室之前使用，查询会议室状态判断是否可以预定", inputDesc = "", outPutDesc = "会议室状态")

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > 应用实践
设置背景及人设 - 盘古大模型 PanguLargeModels

例如，“结合金融领域相关知识，生成一份调研报告大纲，报告主题是区块链洞察”、“以上是某理财app用户反馈的问题，请提供解决方案。” 人设：增加人设可以让生成的内容更符合该领域需求。例如，“假设你是一位银行面试官，请生成10个银行面试问题。”、“假如你是一个高级文案策划，请生成1

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
开通API - 盘古大模型 PanguLargeModels

您可按照需要选择是否开启内容审核。开启内容审核后，可以有效拦截大模型输入输出的有害信息，保障模型调用安全，推荐进行开启。图3 大模型内容审核盘古大模型支持通过对接内容审核，实现拦截大模型输入、输出的有害信息，保障模型调用安全。用户在开通API后，可依据需求选择是否开通、启用内容审核。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API

总条数： 62

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么微调后的模型，只能回答在训练样本中学过的问题 - 盘古大模型 PanguLargeModels

为什么微调后的模型，输入与训练样本相似的问题，回答与训练样本完全不同 - 盘古大模型 PanguLargeModels

为什么微调后的模型，回答总是在重复某一句或某几句话 - 盘古大模型 PanguLargeModels

Cache - 盘古大模型 PanguLargeModels

Cache - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

LLMs（语言模型） - 盘古大模型 PanguLargeModels

运行Agent - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

LLMs（语言模型） - 盘古大模型 PanguLargeModels

数据量足够，但质量较差，可以微调吗 - 盘古大模型 PanguLargeModels

创建数据集清洗任务 - 盘古大模型 PanguLargeModels

打基础 - 盘古大模型 PanguLargeModels

盘古自然语言大模型的适用场景有哪些 - 盘古大模型 PanguLargeModels

盘古大模型-成长地图 - 盘古大模型 PanguLargeModels

撰写提示词 - 盘古大模型 PanguLargeModels

检测数据集质量 - 盘古大模型 PanguLargeModels

Agent助手 - 盘古大模型 PanguLargeModels

设置背景及人设 - 盘古大模型 PanguLargeModels

开通API - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线