检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何判断盘古大模型训练状态是否正常 判断训练状态是否正常,通常可以通过观察训练过程中Loss(损失函数值)的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标,正常情况下越小越好。 您可以从平台的训练日志中获取到每一步的Loss,并绘制成Loss曲线,来观察其变化
如何判断任务场景应通过调整提示词还是场景微调解决 在选择是否通过调整提示词或场景微调来解决任务时,需要从以下两个主要方面进行考虑: 业务数据的可获取性 考虑该任务场景的业务数据是否公开可获取。如果该场景的相关数据可以公开获取,说明模型在训练阶段可能已经接触过类似的语料,因此具有一
时序数据:时序预测数据是一种按时间顺序排列的数据序列,用于预测未来事件或趋势,过去的数据会影响未来的预测。 回归分类数据:回归分类数据包含多种预测因子(特征),用于预测连续变量的值,与时序数据不同,回归分类数据不要求数据具有时间顺序。 具体格式要求详见表1。 表1 预测类数据集格式要求 文件内容 文件格式 文件样例
多轮问答场景的输入(“context”字段)请务必使用“[问题, 回答, 问题, 回答, 问题, ……]”的方式来构造,若您的数据是同一个角色连续多次对话的“多轮问题”,可以将同一个角色的对话采用某个分隔符拼接到一个字符串中。例如: 原始对话示例: A:xxx号话务员为您服务! A:先生您好,有什么可以帮助您的?
"relation_operator":"xx"}]} 步骤4.综合以上内容和json格式,输出json 微调数据清洗: 如下提供了该场景实际使用的数清洗策略,供您参考: 判断数据中的JSON结构是否符合预先定义的接口结构。 异常数据示例如下: {"context": "…", "target": "{\"me
删除异常值后,盐度(S)损失收敛正常,如图4。 表2 验证集选择的时间区段 时间分辨率 推理步数 验证集选择的时间区段(验证集需要至少在以下时间点内,有连续数据 , 才能得到1条测试数据) 24h 7 7天每24h的数据(例:0点,次日0点…7天后0点) 图1 盐度数据偏移与缺失样例-1 图2
根据文本生成回答 根据用户输入的上下文和问题,生成相应回答。可实现事实遵从的合成 生成问答对 文本生成问答对_判断题 该指令能够从用户提供的参考文本中构建出一个判断题,同时给出其正确回答。 文本生成问答对_填空题 该指令能够从用户提供的参考文本中构建出一个填空题,同时给出其正确回答。
文件存放方式要求满足语义分割格式,即原图为jpg文件,标注图采用同名同尺寸的png文件。其中,标注图上的每个像素值对应原图中像素的类别,且每个类别的值需连续且从0开始,表示不同的物体或区域类别。例如,假设有一张原图为IMG_20180919_114732.jpg,对应的标注图为IMG_20180919_114732
计费项 盘古大模型分为模型订阅、数据资源、训练资源和推理资源四个收费项。 模型订阅按照订阅时长预付费,提供1个月到1年供客户选择,自支付完成开始计费。 数据智算单元、数据通算单元支持两种计费方式,包周期订购按使用数量和时长预付费,提供1个月到1年供客户选择,按需订购按单元使用数量
{"context ": ["用微波炉热汤要盖盖子吗? 判断以上问题是否需要调用检索,请回答“是”或”否“"], "target": "否"} {"context ": ["福田区支持哪些组织开展退役军人教育培训工作? 判断以上问题是否需要调用检索,请回答“是”或“否”"], "target
一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。 414 Request URI Too
删除异常值后,盐度(S)损失收敛正常,如图4。 表2 验证集选择的时间区段 时间分辨率 推理步数 验证集选择的时间区段(需要至少在以下时间点内,且有连续数据,才能得到1条测试数据。) 1h 24 24h内每1h的数据(例:0点,1点,2点…次日0点)。 3h 12 36h内每3h的数据(例:0点,3点,
如何对盘古大模型的安全性展开评估和防护 训练智能客服系统大模型需考虑哪些方面 大模型微调训练类问题 如何调整训练参数,使盘古大模型效果最优 如何判断盘古大模型训练状态是否正常 为什么微调后的盘古大模型评估结果很好,但实际场景表现很差 数据量足够,为什么盘古大模型微调效果仍然不好 大模型使用类问题
支持分析语种包括:中文、英文。 通用质量评估 针对文本进行通用质量的评估,例如流畅度、清晰度、丰富度等。 问题时效性评估 判断问题是否具有时效性,并给出判断原因。 回答质量评分 针对微调数据集的回答进行质量评分,例如逻辑连贯性、事实正确性等。 语法质量评估 针对文本进行语法质量的评估,例如相关性、规范性等。
1。 图文文本语言过滤 通过语种识别模型得到图文对的文本语种类型,“待保留语种”之外的图文对数据将被过滤。 图文去重 基于结构化图片去重 判断相同文本对应不同的图片数据是否超过阈值,如果超过则去重。 图片去重 通过把图片结构化处理后,过滤重复的图片/图文对数据。 数据打标 图片鉴黄评分
常见问题 使用java sdk出现第三方库冲突 当出现第三方库冲突的时,如Jackson,okhttp3版本冲突等。可以引入如下bundle包(3.0.40-rc版本后),该包包含所有支持的服务和重定向了SDK依赖的第三方软件,避免和业务自身依赖的库产生冲突: <dependency>
请重新获取token,使用不过期的token。 请检查AK/SK是否正确(AK对应的SK错误,不匹配;AK/SK中多填了空格)。 AK/SK频繁出现鉴权出错,连续错误5次以上,被锁定5分钟(5分钟内,则一直认为其是异常的鉴权请求),5分钟后解锁重新认证。 检查账号权限,是否欠费,被冻结等。 检查调用
每个分支条件支持添加多个判断条件(且、或),同时支持添加多个条件分支。 判断节点为可选节点,若无需配置,可跳过该步骤。 判断节点配置步骤如下: 拖动左侧“判断”节点至画布中,单击该节点以打开节点配置页面。 参照表6,完成判断节点的配置。 表6 判断节点配置说明 配置类型 参数名称
05可认为是视频基础质量较高的视频。 美学评分 从内容(吸引人,清晰度)、构图(目标物位置良好)、颜色(有活力,令人愉悦)、光线(光线明显有对比度)、轨迹(连续、稳定)等维度评价视频美感得分。分值范围(0, 1),数值越高美感越好,评分>0.95可视为视频基础质量较高的视频。 水印识别 识别视频中是否包含水印。
流程型Agent:以工作流为任务执行核心,用户通过在画布上对节点进行“拖拉拽”即可搭建出任务流程,场景的节点包括大模型节点、意图识别节点、提问器节点、插件节点、判断节点、代码节点、消息节点,优点是可扩展能力强,用户适当使用低码开发,缺点是对话交互智能度不高,复杂场景下分支多,难以维护。 父主题: 开发盘古大模型Agent应用