搜索_华为云

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

建盘古预测大模型数据集流程见表2。表2 盘古预测大模型数据集构建流程流程子流程说明操作指导导入数据至盘古平台创建导入任务将存储在OBS服务中的数据导入至平台统一管理，用于后续加工或发布操作。导入数据至盘古平台发布预测类数据集流通预测类数据集数据流通是将单个

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型
创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

例（默认为 0.2，即训练集占0.8，验证集占0.2）。可选比例包括0.1、0.2、0.3、0.4。基模型算法池对于异常检测模型：从预定义的算法池中选择用于训练模型的算法，算法包括：["knn", "iforest", "loda", "oc"]，其中： knn表示k最近邻算法。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古预测大模型 > 训练预测大模型
评估视频类数据集 - 盘古大模型 PanguLargeModels

择预置标准作为参考项，并填写“评估标准名称”和“描述”。单击“下一步”，编辑评估项。用户可以基于实际需求删减评估项，或创建自定义评估项。创建自定义评估项时，需要将评估类别、评估项、评估项说明填写清晰，填写时确保描述无歧义。单击“完成创建”以创建评估标准。评估标准创建完成后

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布视频类数据集
基本概念 - 盘古大模型 PanguLargeModels

过程中，您需要用到账号、用户和密码等信息。区域（Region）从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
评估文本类数据集 - 盘古大模型 PanguLargeModels

择预置标准作为参考项，并填写“评估标准名称”和“描述”。单击“下一步”，编辑评估项。用户可以基于实际需求删减评估项，或创建自定义评估项。创建自定义评估项时，需要将评估类别、评估项、评估项说明填写清晰，填写时确保描述无歧义。单击“完成创建”以创建评估标准。评估标准创建完成后

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
评估图片类数据集 - 盘古大模型 PanguLargeModels

择预置标准作为参考项，并填写“评估标准名称”和“描述”。单击“下一步”，编辑评估项。用户可以基于实际需求删减评估项，或创建自定义评估项。创建自定义评估项时，需要将评估类别、评估项、评估项说明填写清晰，填写时确保描述无歧义。单击“完成创建”以创建评估标准。评估标准创建完成后

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布图片类数据集
查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

评分后，统计得分为5分的占比。 badcase 模型生成句子与实际句子基于评估指标得到的评分后，统计得分1分以下的占比。用户自定义的指标由用户定义的指标，如有用性、逻辑性、安全性等。父主题：评测NLP大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
工作流 - 盘古大模型 PanguLargeModels

参数对应。 plugin_configs 否 List<PluginConfig> 插件配置，当工作流有配置用户自定义插件节点时，可能需要配置鉴权信息等，具体结构定义详见表4。表4 PluginConfig参数参数是否必选参数类型描述 plugin_id 是 String

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API > Agent开发
成长地图 - 盘古大模型 PanguLargeModels

为什么微调后的盘古大模型总是重复相同的回答？盘古大模型是否可以自定义人设？更多大模型概念类如何对盘古大模型的安全性展开评估和防护？训练智能客服系统大模型需考虑哪些方面？更多大模型使用类盘古大模型是否可以自定义人设？如何将本地的数据上传至平台？导入数据过程中，为什么无法选中OBS的具体文件进行上传？

帮助中心 > 盘古大模型 PanguLargeModels > 成长地图
管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

域项目中的资源。可以选择“全局服务资源”，即服务部署时不区分区域，访问全局级服务，不需要切换区域，全局服务不支持基于区域项目授权。如对象存储服务（OBS）、内容分发网络（CDN）等。选择完成后，单击“确定”。图4 设置最小授权范围单击“完成”，完成用户组授权。图5 完成授权

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作 > 创建并管理盘古工作空间
准备工作 - 盘古大模型 PanguLargeModels

Access Key（SK）。下载的访问密钥为credentials.csv文件，包含AK/SK信息。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。使用推理SDK章节示例代码均以ak和sk保存在环境变量中来实现身份验证。

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
标注视频类数据集 - 盘古大模型 PanguLargeModels

如果选择“视频Caption”标注项，则可开启“AI预标注”功能。AI预标注将自动生成标注内容，不会覆盖原始数据集，供标注人员参考，以提高标注效率。如果选择“自定义”标注项，则可自定义添加标注内容及名称，包括单层级分类、多层级分类、文本描述。单层级分类：单层级分类是最简单的一种标注方式，通常指对视频内容进行单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 加工视频类数据集
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

综合以上内容和json格式，输出json 微调数据清洗：如下提供了该场景实际使用的数清洗策略，供您参考：判断数据中的JSON结构是否符合预先定义的接口结构。异常数据示例如下： {"context": "…", "target": "{\"metrics\":['AvgProfits'

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
常见问题 - 盘古大模型 PanguLargeModels

服务端返回的数据格式不符合json格式，导致sdk侧解析json数据报错。服务端返回的json数据不符合json反序列化的规则，和sdk定义的数据结构不一致，导致反序列化失败。 sdk json数据解析问题。建议排查服务端返回的数据是否和服务SDK设计的结构、字段一致。 SDK运行报错

 帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
编排应用 - 盘古大模型 PanguLargeModels

或频繁出现相同词汇。平衡的：平衡模型输出的随机性和准确性。创意性的：模型输出内容更具多样性和创新性，某些场景下可能会偏离主旨。自定义：自定义大模型输出的温度和核采样值，生成符合预期的输出。温度调高温度会使得模型的输出更多样性和创新性，反之，降低温度会使输出内容更加遵循指

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 编排与调用应用
压缩NLP大模型 - 盘古大模型 PanguLargeModels

选择。 INT8：该压缩策略将模型参数压缩至8位字节，可以有效降低推理显存占用。 INT4：该压缩策略与INT8相比，可以进一步减少模型的存储空间和计算复杂度。配置资源。选择计费模式并设置训练单元。可选择开启订阅提醒。开启后，系统将在本次压缩任务状态变更时，向用户发送短信/邮件提醒。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
创建插件 - 盘古大模型 PanguLargeModels

需要提供密钥鉴权参数名和密钥值，安全性较低。请求头插件服务的请求头。添加请求的数据格式等说明，敏感信息请通过权限校验的方式实现。自定义插件使用HTTP服务，或不增加鉴权方式可能存在安全风险。单击“下一步”，在“参数信息”页面，参照表2完成参数配置。表2 插件参数配置说明

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

在“从资产选模型”选择所需模型。部署方式选择“云上部署”。作业输入方式选择 “OBS”表示从OBS中读取数据。作业输出方式选择 “OBS”表示将输出结果存储在OBS中。作业配置参数设置模型部署参数信息，平台已给出默认值。安全护栏选择模式安全护栏保障模型调用安全。选择类型当前支持安

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型 > 部署科学计算大模型
创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

关闭：关闭后不保存checkpoints，无法基于checkpoints执行续训操作。自动：自动保存训练过程中的所有checkpoints。自定义：根据设置保存指定数量的checkpoints。训练参数训练轮数表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。数据批量大小

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
数据集加工场景介绍 - 盘古大模型 PanguLargeModels

通过专用的清洗算子对数据进行预处理，确保数据符合模型训练的标准和业务需求。不同类型的数据集使用专门设计的算子，例如去除噪声、冗余信息等，提升数据质量。数据合成利用预置或自定义的数据指令对原始数据进行处理，并根据设定的轮数生成新数据。该过程能够在一定程度上扩展数据集，增强训练模型的多样性和泛化能力。数据标注为

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集

总条数： 74

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建预测大模型数据集 - 盘古大模型 PanguLargeModels

创建预测大模型训练任务 - 盘古大模型 PanguLargeModels

评估视频类数据集 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

评估文本类数据集 - 盘古大模型 PanguLargeModels

评估图片类数据集 - 盘古大模型 PanguLargeModels

查看NLP大模型评测报告 - 盘古大模型 PanguLargeModels

工作流 - 盘古大模型 PanguLargeModels

成长地图 - 盘古大模型 PanguLargeModels

管理盘古工作空间成员 - 盘古大模型 PanguLargeModels

准备工作 - 盘古大模型 PanguLargeModels

标注视频类数据集 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

编排应用 - 盘古大模型 PanguLargeModels

压缩NLP大模型 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

创建科学计算大模型部署任务 - 盘古大模型 PanguLargeModels

创建NLP大模型训练任务 - 盘古大模型 PanguLargeModels

数据集加工场景介绍 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线