检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据格式:多轮问答场景需要按照指定的数据格式来构造,问题需要拼接上历史所有轮对话的问题和回答。比如,当前是第三轮对话,数据中的问题字段需要包含第一轮的问题、第一轮的回答、第二轮的问题、第二轮的回答以及第三轮的问题,答案字段则为第三轮的回答。以下给出了几条多轮问答的数据样例供您参考: 原始对话示例: A:你是谁? B:您好,我是盘古大模型。
PASCAL VOC格式说明 字段 是否必选 说明 folder 是 表示图像所在的目录名称。 filename 是 被标注文件的文件名。 size 是 表示图像的像素信息。 width:必选字段,图像的宽度。 height:必选字段,图像的高度。 depth:必选字段,图像的通道数。 segmented
据的输出(target字段)需要符合业务场景需求。因此,针对该问题,需要严格控制数据质量。若输入(context字段)要求文案300字以内,则输出必须要满足300字以内。 问题二:模型生成的文案中重复讨论一个相同的话题。 解决方案:对于这种情况,可以尝试修改推理参数。例如,降低“
示词设置为“你是一个旅游助手,需要给用户介绍旅行地的风土人情。请介绍下{{location}}的风土人情。”在评估提示词效果时,可以通过批量替换{{location}}的值,来获得模型回答,提升评测效率。 同时,撰写提示词过程中,可以通过设置模型参数来控制模型的生成行为,如调整温
解决: 问题一:JSON字段缺失、JSON字段或值错误。 解决方案:对于这几种情况,需要在微调数据中增大该缺失字段的数据比例,同时也可以在Prompt中加入对该字段的强调。 问题二:JSON格式错误、JSON内容发散。 解决方案:对于这种情况,可以尝试修改推理参数。例如降低“温度
图3 调测指南 表1 预置数据指令清单 指令分类 指令名称 指令描述 生成问题 问题改写为更低难度 该指令可以通过用户输入的问题,使大模型按要求生成一个难度更低、更为简单的问题。 问题改写为更高难度 该指令通过用户输入的问题,使大模型按要求生成一个难度更高、更为复杂的问题。 基于提问生成作答要求
ALLOW_LEADING_DECIMAL_POINT_FOR_NUMBERS 这个字段是jackson-core里面用来标识解析json格式数据是否支持前导小数点的字段,这个报错的意思是找不到这个字段,很可能是因为用户使用的jackson版本太老导致。 建议客户本地将jackson版本升级到和华为云java
参数填写完成后,单击“立即创建”,回退至“模型评测 > 人工评测”页面。 当状态为“待评测”时,可以单击操作列“在线评测”进入评测页面。 依据页面提示对评估效果区域进行评测打分,全部数据评测完成后单击“提交”。 图1 人工评测示例 在“人工测评”页面,评测任务的状态将显示为“已完成”,单击操作列“评测报告”查看模型评测结果。
在接口的URI部分,请求方法为“POST”,例如: POST https://{endpoint}/v1/{project_id}/deployments/{deployment_id}/chat/completions 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如,定
如何对盘古大模型的安全性展开评估和防护 盘古大模型的安全性主要从以下方面考虑: 数据安全和隐私保护:大模型涉及大量训练数据,这些数据是重要资产。为确保数据安全,需在数据和模型训练的全生命周期内,包括数据提取、加工、传输、训练、推理和删除的各个环节,提供防篡改、数据隐私保护、加密、审计和
式的视频。 单个文件大小不超过50GB,文件数量最多1000个。 事件检测 视频+json 数据源样本为avi、mp4格式,标注文件为json格式。必须包含两个及以上后缀名字为avi或者mp4的文件。 每个视频时长要大于128s,FPS>=10,且测试集训练集都要有视频。 支持视
更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 404 Not Fou 所请求的资源不存在。 建议直接修改该请求,不要重试该请求。 405 Method Not Allowed 请求中带有该资源不支持的方法。 建议直接修改该请求,不要重试该请求。 406
问题或回答中带有不需要的特定格式内容或者时间戳等。 通过编写代码、正则表达式等进行处理,删除或者修改对应的内容,或者直接过滤掉整条数据。 2 原始数据不符合特定微调数据的格式。 通过编写代码进行处理,修改为特定微调格式的数据,例如对于阅读理解微调数据,需要拼接上阅读理解对应的Prompt。
NLP大模型的训练分为两个关键阶段:预训练和微调。 预训练阶段:在这一阶段,模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础,如阅读理解、文本生成和情感分析,但它还未能针对特定任务进行优化。 针对预训练阶段,还可以继续进行训练,这一
值调整该阈值。 取值范围为0.01~0.99。 topk召回数量 召回的相关性阈值top切片数量,如topk召回数量为5,则相关性阈值为前5的切片将被召回提交给大模型总结。 取值范围为1~6。 输出参数 - 知识检索节点输出的参数output_list为一个数组,包含文档名称(d
是 String 发送的实体的MIME类型,参数值为“application/json”。 stream 否 Boolean 是否开启流式调用。 true:开启 false:不开启 说明: 当前Agent只支持流式调用,需设置为true。 表3 请求Body参数 参数 是否必选 参数类型
步骤3:添加插件 为应用添加插件技能。 步骤4:添加工作流 为应用添加工作流技能。 步骤5:添加知识库 为应用添加知识库。 步骤6:配置对话体验 为应用配置优化体验,提升用户体验。 步骤7:调试应用 调试应用的各个模块,确保其功能和表现符合预期。 Agent应用支持的模型类型为NLP大模型。
2024年10月发布的版本,用于天气基础要素预测,时间分辨率为1小时,1个训练单元起训及1个实例部署。 Pangu-AI4S-Weather_1h-3.0.0 2024年12月发布的版本,相较于10月发布的版本模型运行速度有提升,用于天气基础要素预测,时间分辨率为1小时,1个训练单元起训及1个实例部署。
String 发送的实体的MIME类型,参数值为“application/json”。 stream 是 Boolean 是否开启流式调用,默认开启。 true:开启 false:不开启 说明: 当前Agent只支持流式调用,需设置为true。 表3 请求Body参数 参数 是否必选
error。 根据对应error message信息确定具体出错的参数定义。 105005 插件定义不合法。 插件定义时的数据不合法,例如字段定义超出最长长度,具体根据error message判断。 105008 插件内部错误。 请联系客服解决。 105010 插件运行时鉴权出错。