检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
看详情”,可在服务列表中申请需要开通的服务。 文本补全:给定一个提示和一些参数,模型会根据这些信息生成一个或多个预测的补全。例如让模型依据要求写邮件、做摘要总结、生成观点见解等。 多轮对话:基于对话问答功能,用户可以与模型进行自然而流畅的对话和交流。 图1 服务管理 图2 申请开通服务
准备工作 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 检查开发环境要求,确认本地已具备开发环境。 开通盘古大模型API。 登录盘古大模型套件平台。 在左侧导航栏中选择“服务管理”,在相应服务的操作列单击“查看详情”,可在服务列表中申请需要开通的服务。
Id> <version>[3.0.40-rc, 3.1.0)</version> </dependency> jackson版本要求请见pom.xml。 使用java sdk出现json解析报错 图1 json解析报错 服务端返回的数据格式不符合json格式,导致sdk侧解析json数据报错。
理解底层任务 需要站在模型的角度理解相关任务的真实底层任务,并清晰描述任务要求。 例如,在文档问答任务中,任务本质不是生成,而是抽取任务,需要让模型“从文档中抽取出问题的答案,不能是主观的理解或解释,不能修改原文的任何符号、字词和格式”, 如果使用“请阅读上述文档,并生成以下问题
云上购买的盘古大模型资源的权限隔离,可以使用统一身份认证服务(IAM)和盘古角色管理功能进行精细的权限管理。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户(子用户)进行权限管理,可以跳过本章节,不影响您使用服务的其他功能。 通过IAM,您可以在华为云账号中为员工创
有问题。即使您的目标场景依赖垂域背景知识,微调也并非最佳方案,比如: 场景微调的数据量很少或者数据质量很差:微调对数据量和数据质量有很高的要求,需要使用高质量的数据进行模型训练。 垂域知识问答场景:通用模型本身已经具有在给定的一段或几段段落知识的场景下进行总结回答的能力。因此,如
隔离,您可以使用统一身份认证服务(IAM)并结合盘古大模型套件平台提供的“角色管理”功能实现精细的权限管理。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户(子用户)进行权限管理,您可以跳过本章节,不影响您使用盘古的其他功能。 创建用户组 使用主账号登录IAM服务控制台。
准备盘古大模型训练数据集 训练数据集创建流程 模型训练所需数据量与数据格式要求 创建一个新的数据集 检测数据集质量 清洗数据集(可选) 发布数据集 创建一个训练数据集
提示词也称为Prompt,是与大模型进行交互的输入,可以是一个问题、一段文字描述或者任何形式的文本输入。 提示词要素 指令:要求模型执行的具体任务或回答的问题。如:“写一篇关于勇士的小说”、“天空为什么是蓝色的?” 说明:对任务要求的补充说明。如:“有冒险、友情等元素”、“生成文本少于200字” 上下文:提供角色、示例、外部信息等,供大模型参考。
细的数据质量。 其中,数据长度按照token长度划分为2K以下、2K-4K、4K-8K等多个区间,用户可以参考模型训练所需数据量与数据格式要求,调整训练数据。 图1 校验数据集质量 表1 健康度校验规则说明 校验项 说明 异常符号校验 数据中不能存在异常字符,异常字符示例如下。 \u0000
法进行调测,具体步骤请参见部署为在线服务。 文本补全:给定一个提示和一些参数,模型会根据这些信息生成一个或多个预测的补全。例如,让模型依据要求写邮件、做摘要总结、生成观点见解等。 多轮对话:基于对话问答功能,用户可以与模型进行自然而流畅的对话和交流。 图1 使用能力调测 表1 能力调测参数说明
质量数据进行微调。 一份高质量的数据应具备以下几类特征: 数据与目标任务一致:微调数据应该与微调任务的目标和分布保持一致,反映出任务的实际要求。比如,现在需要微调一个情感分类的模型,模型只需要回复“消极”或者“积极”: 情感分类场景-典型低质量数据:数据中存在与目标任务不一致的样本。
参数填选完成后,单击“立即创建”。创建好的OBS桶将显示在桶列表中。 图6 OBS页面 在OBS中创建文件目录,并在目录中上传数据文件。 创建一个新的数据集 创建数据集前,需按要求将数据文件上传至OBS。 登录盘古大模型套件平台,左侧导航栏中选择“数据工程 > 数据管理”,单击界面右上角“创建数据集”。 图7 数据管理
指标适用的任务场景 任务答案是相对比较确定的,例如固定答案的问答任务、NL2SQL、NL2JSON、文本分类等。 指标不适用的任务场景 文案创作、聊天等符合要求即可的场景,该类场景的创作型更强,不存在唯一答案。 指标与模型能力的关系 BLEU指标用于评估模型生成句子(candidate)与实际句子
pkgs // 包目录,用户自行命名 docker docker.tgz // docker 二进制文件,要求版本>19.0.3 certs // 使用generate命令生成的证书,指定--pkg-path后会自动创建到certs目录
中断策略:当相关性得分小于设置的阈值,则不召回任何工具,终止后续流程。 阈值:指工具召回的相关性得分的阈值。阈值越高,召回工具的数量越少,但对召回工具的准确性要求更高。 多轮改写模型:对用户的问题进行多次改写,以增加召回内容的多样性。 检索工具数量:指在处理用户问题时,会检索出相关性最高的前N个工具。
义的加解密组件: 在一个module(yourmodule)中自定义一个解密方法decrypt_func(key_id, cipher),要求可以通过`from yourmodule import decrypt_func`这样的方式使用该方法。 在配置文件中配置`sdk.crypto
比,详情请参考数据配比功能介绍。 在训练数据集配比完成后,在单击“创建”或后续修改保存时,会对数据集的有效数据进行统计,确保满足模型训练的要求。 图3 数据配置 基本配置 填写训练数据集名称和描述,选择数据标签。 图4 基本配置 参数填选完成后,单击“立即创建”。 数据配比功能介绍