检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文本文档数据。支持上传常见文本格式,包括:txt、doc、docx、pdf、ppt、pptx格式。 表格数据。支持上传常见的表格文件格式,便于管理和分析结构化数据,包括:xlsx、xls、csv格式。 无论是文本文档、演示文稿,还是电子表格文件,用户都可以轻松地将数据导入知识库,无需额外的转换或格式处理。 父主题:
台,切换区域至华北-北京四,在“总览”页面下方开通“文本翻译”服务。 图1 开通文本翻译服务 操作流程 创建多语言文本翻译插件的流程见表1。 表1 创建多语言文本翻译插件流程 操作步骤 说明 步骤1:获取文本翻译服务Token与调用地址 本样例场景实现文本翻译服务Token与调用地址的获取。
步骤3:添加预置插件 应用支持添加插件技能,可添加“预置插件”和“个人插件”。添加插件可以为应用配备更多技能,建议插件数量不超过5个。 本节示例将指导您添加名为python_interpreter的“预置插件”。 添加插件的步骤如下: 在“技能 > 插件”模块,单击“添加”。 在
每个工程任务下候选提示词上限9个,达到上限9个时需要删除其他候选提示词才能继续添加。 登录ModelArts Studio大模型开发平台,进入所需空间。 在左侧导航栏中选择“Agent开发 > 提示词工程 > 提示词开发”。 在工程任务列表页面,找到所需要操作的工程任务,单击该工程任务右侧“撰写”。
truncated:必选字段,取值0或1,表示标注内容是否被截断(0表示被截断、1表示没有截断)。 occluded:必选字段,取值0或1,表示标注内容是否被遮挡(0表示未遮挡、1表示遮挡) difficult:必选字段,取值0或1,表示标注目标是否难以识别(0表示容易识别、1表示难易识别)。 con
可选择开启“多人作业”功能,开启后,可选择多人协同完成作业,并增加审核功能可供选择。参考表2配置标注分配与审核。 表2 标注分配与审核配置 参数类型 参数名称 参数说明 标注分配 标注员 添加标注人员与数量。 标注审核 是否审核 否,标注后不进行审核操作。 是,审核员会检查标注员
合函数(如去重、计数、平均、最大、最小、合计)、分组、排序、比较、条件(逻辑操作、离散条件、范围区间等条件的混合和嵌套)、日期操作,支持多表关联查询。 与非专业大模型相比,专业大模型针对特定场景优化,更适合执行数据分析、报告生成和业务洞察等任务。 ModelArts Studio
提示词是用来引导模型生成的一段文本。撰写的提示词应该包含任务或领域的关键信息,如主题、风格、格式等。 撰写提示词时,可以设置提示词变量。即在提示词中通过添加占位符{{ }}标识表示一些动态的信息,让模型根据不同的情况生成不同的文本,增加模型的灵活性和适应性。例如,将提示词设置为“你是一个旅游助手,需要给用
//视频文件扩展名。 // 标注 34.5, 42.4 分别表示起始时间和结束时间,单位为s。 // label 表示分类,必须是classes列表中的一个元素,表示该视频片段对应的事件或动作类型。 'annotations':
集文件内容包括:预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等,不同训练方式所需要使用的数据见表1,该数据集格式要求请参见文本类数据集格式要求。 表1 训练NLP大模型数据集类型要求 基模型 训练场景 数据集类型 数据集内容 文件格式 NLP 预训练 文本 预训练文本
参数-类型-解释表中\n\n以下是你的思考过程:\n步骤1.根据用户问题从指标-解释表中得到metrics中caption的值,格式为:\"metrics\":[{\"caption\":\"xx\"}],不要超过两个\n步骤2.根据用户问题从参数-类型-解释表中得到dimens
如果需要添加工作流,请确保已完成编排工作流操作。 添加工作流的步骤如下: 在“技能 > 工作流”模块,单击“”。 在“添加工作流”窗口,单击“”进行添加,再单击“确定”。 图4 添加工作流 添加插件后,可在“技能 > 工作流”中查看当前已添加的工作流。 图5 已添加工作流 步骤5:添加知识库 应用支持添加知识库。发送
可选择开启“多人作业”功能,开启后,可选择多人协同完成作业,并增加审核功能可供选择。参考表2配置标注分配与审核。 表2 标注分配与审核配置 参数类型 参数名称 参数说明 标注分配 标注员 添加标注人员与数量。 标注要求 选择标注项为“图片Caption”且开启AI预标注功能时,可设置以下两种方式的“标注要求”:
可选择开启“多人作业”功能,开启后,可选择多人协同完成作业,并增加审核功能可供选择。参考表2配置标注分配与审核。 表2 标注分配与审核配置 参数类型 参数名称 参数说明 标注分配 标注员 添加标注人员与数量。 标注审核 是否审核 否,标注后不进行审核操作。 是,审核员会检查标注员
设置训练数据的表面变量信息。在“预训练”场景中,可以添加或去除新的表面变量,选中后会在变量权重中增加或移除该变量,训练任务将根据配置的表面变量重新训练模型。 表面静态量 表面静态量默认包括地形高度、LAND_MASK和SOIL_TYPE,用于初始化模型状态并提供地表特性信息。当前不支持添加或去除这些静态量。 L
模型监控与迭代:部署后的模型需要持续监控其性能,并根据反馈进行定期更新或再训练。随着新数据的加入,模型可能需要进行调整,以保证其在实际应用中的表现稳定。 在应用阶段,除了将模型嵌入到具体业务流程中外,还需要根据业务需求不断对模型进行优化,使其更加精准和高效。 父主题: 基础知识
据的获取、加工、合成、标注、配比、评估、发布等环节,成为数据开发中不可或缺的重要步骤。 数据工程操作流程见图1、表1。 图1 数据集构建流程图 表1 数据集构建流程表 流程 子流程 说明 导入数据至盘古平台 创建导入任务 将存储在OBS服务中的数据导入至平台统一管理,用于后续加工或发布操作。
复的数据条目。 典型的数据加工方法及示例见表1 典型数据加工方法。ModelArts Studio平台已经集成了常见的数据加工算子,可以参考《用户指南》“使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍”进行数据加工。 表1 典型数据加工方法 数据加工方法 方法说明
可以前端页面为准。 比较对象、值:条件表达式右边部分,支持“引用”和“输入”两种类型。 引用:支持用户选择工作流中已包含的前置节点输出变量值。 输入:支持用户自定义取值。 添加条件:单击“添加条件”,在当前分支添加多个条件表达式,多个条件表达式之间通过“且”或“或”来连接。 单击
多语言文本翻译插件操作。 为使该实践效果更优,建议部署盘古NLP大模型的N4系列模型。 操作流程 创建盘古多语言文本翻译工作流的流程见表1。 表1 创建盘古多语言文本翻译工作流流程 操作步骤 说明 步骤1:创建并配置多语言文本翻译工作流 本样例场景实现多语言文本翻译工作流的创建与配置。