搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一些将无监督数据转换为有监督数据的方案，供您参考：基于规则构建：您可以通过采用一些简单的规则来构建有监督数据。比如：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
创建多语言文本翻译插件 - 盘古大模型 PanguLargeModels

本样例场景实现文本翻译服务Token与调用地址的获取。步骤2：创建并配置多语言文本翻译插件本样例场景实现多语言文本翻译插件的创建与配置。步骤1：获取文本翻译服务Token与调用地址在创建多语言文本翻译工作流的实践中，需要调用华为云文本翻译服务API，调用前需获取文本翻译服务的Token，获取Token步骤如下：

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流 > 附录
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

型消除语义歧义性，识别用户查询意图，并直接生成支持下游操作的结构化JSON信息。大模型的NL2JSON能力可以从自然语言输入抽取关键信息并转换为JSON格式输出，以供下游操作，从而满足该场景下客户需求。金融场景下，NL2JSON能力可以有效消除用户语义歧义性，提高数据处理的灵活

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
大模型微调训练类问题 - 盘古大模型 PanguLargeModels

大模型微调训练类问题无监督领域知识数据量无法支持增量预训练，如何进行模型学习如何调整训练参数，使盘古大模型效果最优如何判断盘古大模型训练状态是否正常如何评估微调后的盘古大模型是否正常如何调整推理参数，使盘古大模型效果最优为什么微调后的盘古大模型总是重复相同的回答为什么微调后的盘古大模型的回答中会出现乱码

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
大模型概念类问题 - 盘古大模型 PanguLargeModels

大模型概念类问题如何对盘古大模型的安全性展开评估和防护训练智能客服系统大模型需考虑哪些方面

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

、表单、公式等内容提取。数据转换个人数据脱敏对文本中的手机号码、身份证件、邮箱地址、url链接、国内车牌号、IP地址、MAC地址、IMEI、护照、车架号等个人敏感信息进行数据脱敏，或直接删除敏感信息。中文简繁转换将中文简体和中文繁体进行转换。符号标准化查找文本中携带的非标准化符号进行标准化、统一化转换。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
请求URI - 盘古大模型 PanguLargeModels

请求URI 服务的请求URI即API服务的终端地址，通过该地址与API进行通信和交互。 URI获取步骤如下：登录ModelArts Studio大模型开发平台。进入所需工作空间。获取请求URI。获取模型请求URI。若调用部署后的模型，可在左侧导航栏中选择“模型开发 >

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
知识库介绍 - 盘古大模型 PanguLargeModels

结构化数据，包括：xlsx、xls、csv格式。无论是文本文档、演示文稿，还是电子表格文件，用户都可以轻松地将数据导入知识库，无需额外的转换或格式处理。父主题：创建与管理知识库

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类清洗算子，算子能力清单见表1。表1 图片类清洗算子能力清单算子分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类清洗算子能力清单

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
变更计费模式 - 盘古大模型 PanguLargeModels

变更计费模式盘古大模型的模型订阅、数据托管单元、推理单元默认采用包周期计费，数据智算单元、数据通算单元默认采用按需计费，训练单元采用包周期和按需计费两种方式。盘古大模型使用周期内不支持变更配置。

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

使用Python脚本转换自定义格式为jsonl格式对于文本类数据集，除文档、网页数据类型，其余类型的数据支持将自定义格式转换为jsonl格式。用户可以上传自定义的python脚本实现数据集由自定义格式到jsonl格式的转换，页面中会提供脚本示例，可下载作为参考。自定义格式转换的具体步骤为：

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
安全 - 盘古大模型 PanguLargeModels

安全责任共担身份认证与访问控制数据保护技术审计

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
大模型开发基本概念 - 盘古大模型 PanguLargeModels

大模型的计量单位token指的是什么令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个to

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

选择合适的模型，从而提高模型的整体效果，详见表1。此外，不同类型的NLP大模型在训练过程中，读取中文、英文内容时，字符长度转换为Token长度的转换比有所不同，详见表2。表1 不同系列NLP大模型对处理文本的长度差异模型名称可处理最大Token长度说明 Pangu-N

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
提示词工程类 - 盘古大模型 PanguLargeModels

提示词工程类如何利用提示词提高大模型在难度较高推理任务中的准确率如何让大模型按指定风格或格式回复如何分析大模型输出错误回答的根因为什么其他大模型适用的提示词在盘古大模型上效果不佳如何判断任务场景应通过调整提示词还是场景微调解决

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题
责任共担 - 盘古大模型 PanguLargeModels

安全性是华为云与您的共同责任，如图1所示。华为云：负责云服务自身的安全，提供安全的云。华为云的安全责任在于保障其所提供的IaaS、PaaS和SaaS类云服务自身的安全，涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
计费FAQ - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式有什么区别包年/包月和按需计费模式哪个更划算同一资源是否同时支持包年/包月和按需计费两种模式包年/包月和按需计费模式是否支持互相切换资源到期了如何续费

 帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
数据集发布场景介绍 - 盘古大模型 PanguLargeModels

通过这些格式的转换，用户可以确保数据与特定模型（如盘古大模型）兼容，并优化训练效果。提高训练效率发布符合标准的数据集可以大幅提升数据处理效率，减少后续调整工作，帮助用户快速进入模型训练阶段。数据集发布是数据工程中的关键环节，通过科学的数据比例调整和格式转换，确保数据集符合

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集

总条数： 115

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

创建多语言文本翻译插件 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

大模型微调训练类问题 - 盘古大模型 PanguLargeModels

大模型概念类问题 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

请求URI - 盘古大模型 PanguLargeModels

知识库介绍 - 盘古大模型 PanguLargeModels

图片类清洗算子能力清单 - 盘古大模型 PanguLargeModels

气象类清洗算子能力清单 - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

变更计费模式 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

安全 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

提示词工程类 - 盘古大模型 PanguLargeModels

责任共担 - 盘古大模型 PanguLargeModels

计费FAQ - 盘古大模型 PanguLargeModels

数据集发布场景介绍 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线