检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择评估使用的变量数据集和评估方法。 数据集:根据选择的数据集,将待评估的提示词和数据集中的变量自动组装成完整的提示词,输入模型生成结果。 评估方法:根据选择的评估方法,对模型生成结果和预期结果进行比较,并根据算法给出相应的得分。 图3 创建评估 输入评估名称和描述。 图4 输入评估名称 单击
用来标识每个响应的唯一字符串。 created Integer 响应生成的时间。 choices Array of choices objects 生成的文本列表,包含以下属性: message:生成的文本内容。 index:生成的文本在列表中的索引,从0开始。 usage usage object
提示词评估 提示词评估以任务维度管理,支持评估任务的创建、查询、修改、删除。支持创建评估任务,选择候选提示词和需要使用的变量数据集,设置评估算法,执行任务自动化对候选提示词生成结果和结果评估。 提示词管理 提示词管理支持用户对满意的候选提示词进行保存管理,同时支持提示词的查询、删除。
采用规则将无监督数据构建为有监督数据的常用方法 规则场景 说明 文本生成:根据标题、关键词、简介生成段落。 若您的无监督文档中含标题、关键词、简介等结构化信息,可以将有监督的问题设置为“请根据标题xxx/关键性xxx/简介xxx,生成一段不少于xx个字的文本。”,将回答设置为符合要求的段落。
写作示例 意图匹配 面试问题生成 父主题: 提示词写作实践
比较候选提示词信息的差异性,可以单击开启“高亮展示差异点”。 图3 高亮差异点 下拉页面至“提示词效果比较”模块,比较提示词的效果,输入相同的变量值,查看两个提示词生成的结果。 图4 比较提示词的效果 父主题: 横向比较提示词效果
的评估资源。 打分模式:当前版本打分模式仅支持基于规则,用户不可选,且暂无人工打分。基于规则打分:使用预置的相似度或准确率打分规则对比模型生成结果与真实标注的差异,从而计算模型指标。 评估数据: 选择已创建并发布的评估数据集。 基本信息: 输入任务的名称和描述。 单击“立即创建”,创建一个模型评估任务。
N4-基模型支持有监督微调。 表3 盘古-NLP-N2-基模型训练参数推荐 应用场景 参数 推荐值 基础场景(文本分析、文本生成、文本翻译、query生成、开放问答、知识问答、改写、总结聚合、聊天) 数据批量大小 8 训练轮数 4 学习率 0.000075 优化器 adamw 学习率衰减比率
管理模型资产、推理资产 查看模型资产与模型推理资产 用户购买盘古大模型套件后,可以在“平台管理 > 资产管理”中查看购买的模型资产和模型推理资产。 图1 查看模型资产 图2 查看模型推理资产 续订模型推理资产 模型推理资产到期后,可以进行续订操作。 在“平台管理 > 资产管理 >
、平台管理(资产管理、权限管理)功能的使用权限。 推理服务API调用人员 具备总览、服务管理、能力调测、平台管理(权限管理)、运营面板功能的使用权限。 Prompt工程人员 具备总览、应用百宝箱、服务管理、能力调测、数据工程(提示用例管理)、应用开发(提示词工程、提示词管理、工具
ask("写一篇五言律诗").getAnswer(); 支持调整的参数解释。 private int maxTokens; // 完成时要生成的令牌的最大数量 private double temperature; // 调整随机抽样的程度,温度值越高,随机性越大 private
在软件开发领域,编程语言的多样性和复杂性给程序员带来了巨大的挑战。盘古NLP大模型为程序员提供了强大的代码助手,显著提升了研发效率。 盘古大模型能够根据用户给定的题目,快速生成高质量的代码,支持Java、Python、Go等多种编程语言。它不仅能够提供完整的代码实现,还能够根据用户的需求,进行代码补全和不同编程语言之间的改写转化。
upload(upload_file, upload_bt, file_output) greet_btn = gr.Button("生成摘要") output = gr.Textbox(label="输出") greet_btn.click(fn=summary
平台资源管理 管理模型资产、推理资产 获取Token消耗规则
通过指令可以设定A助手的行为和响应。如设置AI助手可以扮演的角色、指定可以访问的工具、设置结果的输出风格等。 模型配置 嵌入模型 用于对AI助手进行任务规划、工具选择和生成回复。 模型版本 选择与“嵌入模型”对应的版本。例如,嵌入模型为N2系列,则模型版本也为N2。 工具配置 网页搜索 开启网页搜索后,可以通
数据多样性:微调数据需要具有一定的多样性,多样性能增加任务的复杂度和难度,让模型能够处理不同的情况和问题,提升模型泛化性。例如,现在需要微调一个文案创作的模型,模型需要生成各个城市的宣传文案: 文案创作场景-典型低质量数据:数据多样性差。 {"context": ["请帮我写一份宣传文案"], "target":
ask("写一篇五言律诗").answer 支持调整的参数解释: max_tokens: Optional[int] # 完成时要生成的令牌的最大数量 temperature: Optional[float] # 调整随机抽样的程度,温度值越高,随机性越大;
应用开发-工具管理 - - - √ √ 应用开发-AI助手 - - - √ √ 应用开发-知识库管理 - - - √ √ 应用开发-应用开发SDK(link) - - - √ √ 平台管理-资产管理 - - √ - √ 平台管理-权限管理 √ √ √ √ √ 平台管理-授权管理 - √
获取模型调用API地址 登录盘古大模型套件平台。 在左侧导航栏中选择“服务管理”,在相应服务的操作列单击“查看详情”,可在服务列表中申请需要开通的服务。 图1 服务管理 在“概览 > 服务列表”中选择需要调用的模型,并单击操作列的“调用路径”。 图2 服务概览页面 在弹窗中可获取
此,为了能够正常的存储数据、训练模型,需要用户配置盘古访问OBS的权限。 使用主账号登录盘古大模型套件平台。 在左侧菜单选择“平台管理 > 授权管理”,单击右上角“一键授权”进行授权。 图1 一键授权 父主题: 准备工作