检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
高频常见问题 大模型概念类问题 如何对盘古大模型的安全性展开评估和防护 训练智能客服系统大模型需考虑哪些方面 大模型微调训练类问题 如何调整训练参数,使盘古大模型效果最优 如何判断盘古大模型训练状态是否正常 为什么微调后的盘古大模型评估结果很好,但实际场景表现很差 数据量足够,为什么盘古大模型微调效果仍然不好
是否提取”功能,可额外配置中文名称。 参数校验:可自定义参数校验规则对输出参数规范性进行校验。规则包括参数名称、校验类型及校验规则。 是否提取:开启后该参数必须提取到或使用默认值,关闭则该参数允许为空或者使用默认值。 反思:在参数提取之后,会根据参数描述与用户指令,对打开反思开关的参数,独立调用大模型进行反思并修正当前提取的结果。
问题三:存在重复数据。 删除重复数据。 略 略 训练模型 自监督训练: 不涉及 有监督微调: 本场景采用了下表中的微调参数进行微调,您可以在平台中参考如下参数进行训练: 表2 微调核心参数设置 训练参数 设置值 数据批量大小(batch_size) 8 训练轮数(epoch) 4 学习率(learning_rate)
不可用的低质量的数据。 训练模型 自监督训练: 不涉及 有监督微调: 该场景采用下表中的微调参数进行微调,您可以在平台中参考如下参数进行训练: 表2 问答模型的微调核心参数设置 训练参数 设置值 数据批量大小(batch_size) 4 训练轮数(epoch) 3 学习率(learning_rate)
单击“下一步”,进入“指令编排”页面。 在左侧“添加指令”中添加预置指令。 指令选择完成后,配置指令参数。 下图展示了预训练文本类数据集的合成指令参数配置示例,该合成任务实现利用预训练文本生成问答对。 图1 预训练文本类数据集合成指令参数配置示例 8. 指令编排完成后,单击右上角“启用调测”,可以对当前编排的指令效果进行预览。
业务数据的可获取性 考虑该任务场景的业务数据是否公开可获取。如果该场景的相关数据可以公开获取,说明模型在训练阶段可能已经接触过类似的语料,因此具有一定的理解能力。这时,通过调整提示词通常可以有效引导模型生成合理的回答。 例如,对于一些常见的问答场景(如常见百科问题),由于这些领域的相关数据
多个任务的底层支持。 通过使用海量的互联网文本语料对模型进行预训练,使模型理解人类语言的基本结构。 微调 关注专业性:微调是对预训练模型的参数进行调整,使其在特定任务中达到更高的精度和效果。微调的核心在于利用少量的特定任务数据,使模型的表现从通用性向具体任务需求过渡。 使用小规模
表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部署ID,获取方法请参见获取模型部署ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型
存在安全风险。 单击“下一步”,在“参数信息”页面,参照表2完成参数配置。 表2 插件参数配置说明 参数类型 参数名称 参数说明 请求参数 参数封装 开启后,会将请求参数封装为一个列表(数组)结构,可适配入参为数组格式的插件接口。 示例:原参数列表:{"a":"string",
API基础上去除末尾的/tasks即是域名。 表1 路径参数 参数 是否必选 参数类型 描述 task_id 是 String 推理作业的ID。 请求参数 无 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 id String 作业ID。 name String
用路径,详见获取调用路径。 填写请求Header参数。 参数名为Content-Type,参数值为application/json。 参数名为X-Auth-Token,参数值为步骤1中获取的Token值。 参数名为stream,参数值为true。当前工作流仅支持流式调用。 在Postman中选择“Body
在“高级配置”中配置提示词。单击“确定”,完成参数配置。 图8 高级配置 配置“提示器”节点。 鼠标拖动左侧“提问器”节点至编排页面,并连接“意图识别”的“文本翻译”意图节点与该节点,单击该节点进行配置。 在“参数配置”中,配置输入参数,如图9。 图9 配置输入参数 配置输出参数。如图10,单击“引用插件
他用户调用时,原有Token认证无法支持,可通过AppCode认证调用请求。 参考表1填写请求Header参数。 表1 请求Header参数填写说明 认证方式 参数名 参数值 Token认证 Content-Type application/json X-Auth-Token T
API基础上去除末尾的/tasks即是域名。 表1 路径参数 参数 是否必选 参数类型 描述 task_id 是 String 推理作业的ID。 请求参数 无 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 id String 作业ID。 name String
> 模型评测 > 任务管理”,单击界面右上角“创建评测任务”。 在“创建评测任务”页面,参考表1完成部署参数设置。 表1 NLP大模型自动评测任务参数说明 参数分类 参数名称 参数说明 选择服务 模型来源 选择“NLP大模型”。 服务来源 支持已部署服务、外部服务两种选项。单次最多可评测10个模型。
选择需要调用的服务。可从“预置服务”或“我的服务”中选择。 填写系统人设。如“你是一个AI助手”,若不填写,将使用系统默认人设。 在页面右侧配置参数,具体参数说明见表1。 表1 NLP大模型能力调测参数说明 参数 说明 搜索增强 搜索增强通过结合大语言模型与传统搜索引擎技术,提升了搜索结果的相关性、准确性和智能化。
resource-path 资源路径,即API访问路径。从具体API的URI模块获取。 query-string 查询参数,可选,查询参数前面需要带一个“?”,形式为“参数名=参数取值”。 获取请求URI的步骤详见请求URI,示例如下: https://{endpoint}/v1/{pro
盘古NLP大模型调优实践 模型调优方法介绍 优化训练数据的质量 优化训练超参数 优化提示词 优化推理超参数 调优典型问题 父主题: 模型调优实践
他用户调用时,原有Token认证无法支持,可通过AppCode认证调用请求。 参考表2填写请求Header参数。 表2 请求Header参数填写说明 认证方式 参数名 参数值 Token认证 Content-Type application/json X-Auth-Token T
_name、project_id、project_name,如图3。 图3 请求体参数获取 请求体参数配置完成后,单击“调试”,在响应结果中单击“响应头”,其中,X-Subject-Token参数的值为获取到的Token,如图4。 图4 获取Token值 获取的文本翻译API调用