检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择“全部标注”:要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。 选择“可部分标注”:允许标注人员在确认AI预标注满足要求后,直接使用AI预标注功能完成数据集的标注并提交标注结果。 标注任务可选择是否启用标注审核,可设置多人审核,详见审核文本类数据集标注结果。审核要求可以选择以下两种方式:
上线原始数据集 在正式发布数据集前,需要执行上线操作。 上线原始数据集 加工数据集 创建文本类数据集加工任务 数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。 说明: 盘古NLP大模型仅支持接入文本类数据集。 若数据类型为文档、网页,则加工数据集为必选项,否则为可选项。
发布不同格式的数据集。 在“格式配置”分页,选择发布格式,单击“下一步”。当前支持默认格式、盘古格式、自定义格式: “默认格式”为数据工程功能支持的原始格式。 “盘古格式”为使用盘古大模型训练或评测时所需要使用的数据格式。 “自定义格式”可以通过自定义格式转换脚本,将数据集转化为
发布不同格式的数据集。 在“格式配置”分页,选择发布格式,单击“下一步”。当前支持默认格式、盘古格式、自定义格式: “默认格式”为数据工程功能支持的原始格式。 “盘古格式”为使用盘古大模型训练或评测时所需要使用的数据格式。 “自定义格式”可以通过自定义格式转换脚本,将数据集转化为
选择“全部标注”:要求标注人员需要对全部的数据进行人工标注后才可提交标注结果。 选择“可部分标注”:允许标注人员在确认AI预标注满足要求后,直接使用AI预标注功能完成数据集的标注并提交标注结果。 标注任务可选择是否启用标注审核,可设置多人审核,详见审核文本类数据集标注结果。审核要求可以选择以下两种方式:
使用规则构建的优点是快速且成本低,缺点是数据多样性较低。 基于大模型的数据泛化:您可以通过调用大模型(比如盘古提供的任意一个规格的基础功能模型)来获取有监督场景。一个比较常见的方法是,将无监督的文本按照章节、段落、字符数进行切片,让模型基于这个片段生成问答对,再将段落、问题和
~ 200个字符,并且字符只允许为下面的类型: 中文 字母(A-Z或a-z) 数字(0-9) 特殊字符:_和- 空格 插件描述 待创建插件的功能描述。 插件描述的长度为1 ~ 1600个字符。 配置插件的配置信息,配置插件URL和请求方式等参数信息。配置完成后,单击“下一步”。 风
工作流 功能介绍 通过调用创建好的工作流API,输入问题,将得到工作流执行的结果。 URI 获取URI方式请参见请求URI。 POST /v1/{project_id}/agent-run/workflows/{workflow_id}/conversations/{conversation_id}
在正式发布数据集前,需要执行上线操作。 上线原始数据集 加工数据集(可选) 创建气象类数据集加工任务 数据集中若存在异常数据,可通过数据集加工功能去除异常字符、表情符号、个人敏感内容等。 创建气象类数据集加工任务 上线加工后的数据集 对加工后的数据集执行上线操作。 上线加工后的文本类数据集
Studio大模型开发平台不仅提供预设的标准,还允许用户根据不同的数据类型和业务需求创建自定义的评估标准,使评估过程更加灵活和精准。 节省时间和成本:通过自动化的数据评估功能,用户能够迅速了解数据的质量问题,减少手动检查的工作量和时间成本,为后续的数据优化和模型训练节省资源。 总的来说,数据评估为用户提供了一种
应用 功能介绍 通过调用创建好的应用API,输入问题,将得到应用执行的结果。 URI 获取URI方式请参见请求URI。 POST /v1/{project_id}/agent-run/agents/{agent_id}/conversations/{conversation_id}
调高温度,会使得模型的输出更具多样性和创新性。 降低温度,会使输出内容更加遵循指令要求,但同时也会减少模型输出的多样性。 配置提示词信息,并选择是否打开记忆功能。 写提示词时,支持使用{{variable}}的格式引用本组件输入参数中已定义好的参数。 Prompt:大模型的系统提示词,用于指导模型更好的完成任务。