搜索_华为云

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

地构建自己的模型和应用。数据工程工具链：数据是大模型训练的核心基础。数据工程工具链作为平台的重要组成部分，具备数据获取、数据加工和数据发布等功能，确保数据的高质量与一致性。工具链能够高效收集并处理各种格式的数据，满足不同训练任务的需求，并提供强大的数据存储和管理能力，为大模型训练提供坚实的数据支持。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格盘古NLP大模型是业界首个超千亿参数的中文预训练大模型，结合了大数据预训练和多源知识，借助持续学习不断吸收海量文本数据，持续提升模型性能。除了实现行业知识检索、文案生成、阅读理解等基础功能外，盘古NLP大模型还具备模型调用等高级特性，可在智能客服、创意

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
责任共担 - 盘古大模型 PanguLargeModels

等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身，也包括运维运营安全，以及更广义的安全合规遵从。租户：负责云服务内部的安全，安全地使用云。华为云租户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
导入数据至盘古平台 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据获取 > 原始数据集”，单击需要查看的数据集名称。查看数据集基本信息。在“基本信息”页签，可以查看数据详情、数据来源以及扩展信息。下载原始数据集。在“数据预览”页签，可以查看数据内容，单击右上角“下载”即可下载原始数据集。查看数据血缘。在“数据血缘”

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
数据工程介绍 - 盘古大模型 PanguLargeModels

通过这些功能，用户可以轻松将大量数据导入平台，为后续的数据加工和模型训练等操作做好准备。数据加工：平台提供了数据清洗、数据合成、数据标注的加工操作，旨在确保原始数据能够满足各种业务需求和模型训练的标准。数据清洗：数据清洗旨在通过使用数据集清洗算子对数据进行预处理操作，针对不同类型的数据集，平台设计

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集
什么是盘古大模型 - 盘古大模型 PanguLargeModels

具备数据获取、清洗、数据合成、数据标注、数据评估、数据配比、数据流通和管理等功能。该工具链能够高效收集和处理各种格式的数据，满足不同训练和评测任务的需求。通过提供自动化的质量检测和数据清洗能力，对原始数据进行优化，确保其质量和一致性。同时，数据工程工具链还提供强大的数据存储和

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

Studio大模型开发平台的空间资产中，包括数据和模型两类资产。这些资产为用户提供了集中管理和高效操作的基础，便于用户实现统一查看和操作管理。数据资产：用户已发布的数据集将作为数据资产存放在空间资产中。用户可以查看数据集的详细信息，包括数据格式、大小、配比比例等。同时，平台支持数据集的删除等管理操作，

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
管理盘古数据资产 - 盘古大模型 PanguLargeModels

管理盘古数据资产数据资产介绍数据资产是指在平台中被纳入管理、存储并可供使用的数据集。数据资产包含以下两种形式：用户自行发布的数据集。用户可以通过“数据工程 > 数据发布 > 数据流通”功能将数据集发布为数据资产。发布的数据集支持查看详细信息、编辑、删除以及发布至AI Gallery等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
权限管理 - 盘古大模型 PanguLargeModels

具备。评估作业员拥有数据工程数据评估-评估作业模块的所有权限，其余角色不具备。数据导入员拥有数据工程数据获取-数据导入模块的所有权限，其余角色不具备。数据加工员拥有数据工程数据加工模块的所有权限，其余角色不具备。数据发布员拥有数据工程数据发布模块的所有权限，其余角色不具备。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 NLP大模型支持接入的数据集类型盘古NLP大模型仅支持接入文本类数据集，数据集文件内容包括：预训练文本、单轮问答、多轮问答、带人设单轮问答、带人设多轮问答等，不同训练方式所需要使用的数据见表1，该数据集格式要求请参见文本类数据集格式要求。表1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型
管理发布后的数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据发布 > 发布数据集”。单击数据集名称查看发布数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看发布后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集
基本概念 - 盘古大模型 PanguLargeModels

通用Region指面向公共租户提供通用云服务的Region；专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。详情请参见区域和可用区。可用区（AZ，Availability Zone）一个AZ是一个或多个物理数据中心的集合，有独立的风火水电

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
产品优势 - 盘古大模型 PanguLargeModels

Studio大模型开发平台数据、模型、Agent应用在统一的入口进行管理，可以快速的掌握资产的使用情况、版本情况和溯源信息等。海量训练数据盘古大模型依托海量且多样化的训练数据，涵盖从日常对话到专业领域的广泛内容，帮助模型更好地理解和生成自然语言文本，适用于多个领域的业务应用。这些数据不仅丰富多

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
打造政务智能问答助手 - 盘古大模型 PanguLargeModels

微调数据清洗：以下是该场景中实际使用的数据清洗策略，供您参考：原始文本处理。基于爬虫、数据处理平台批量处理收集到的原始数据，需要将文件统一转换成纯文本的txt文件，对错误格式数据进行删除。构建微调数据。生成垂域微调（问答对）数据，将问答对数据分为：单轮问答数据、多轮问答数

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
空间管理 - 盘古大模型 PanguLargeModels

数据资产：数据资产是指用户在平台上发布的所有数据集。这些数据集会被存储在数据资产中，用户可以随时查看数据集的详细信息，如数据格式、大小、配比比例等，同时平台会自动记录每个数据集的操作历史，例如创建、发布及上线等过程。为了进一步简化管理，平台还支持数据集的删除功能，使用户能够对数据集进行灵活管理和调整。在模型训

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
模型开发 - 盘古大模型 PanguLargeModels

确保从数据准备到模型部署的每一个环节都能高效、精确地执行，为实际应用提供强大的智能支持。模型训练：在模型开发的第一步，ModelArts Studio大模型开发平台为用户提供了丰富的训练工具与灵活的配置选项。用户可以根据实际需求选择合适的模型架构，并结合不同的训练数据进行精细

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
管理加工后的数据集 - 盘古大模型 PanguLargeModels

在左侧导航栏中选择“数据工程 > 数据加工 > 加工数据集”。单击数据集名称查看加工数据集的基本信息、数据预览、数据血缘以及操作记录。在“基本信息”页签可查看数据集的详细信息。在“数据预览”页签可查看加工后的数据内容。在“数据血缘”页签查看该数据集所经历的操作，如导入、合成等操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集
知识库介绍 - 盘古大模型 PanguLargeModels

平台提供了知识库功能来管理和存储数据，支持为应用提供自定义数据，并与之进行互动。知识库支持导入以下格式的本地文档：文本文档数据。支持上传常见文本格式，包括：txt、doc、docx、pdf、ppt、pptx格式。表格数据。支持上传常见的表格文件格式，便于管理和分析结构化数据，包括：xlsx、xls、csv格式。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理知识库
资源到期了如何续费 - 盘古大模型 PanguLargeModels

登录ModelArts Studio大模型开发平台，单击页面右上角“订购管理”。在“订购管理”页面，单击“资源订购”页签。在“资源订购”页签可进行数据资源、训练资源、推理资源的续费操作。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
文本类数据集格式要求 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 ModelArts Studio大模型开发平台支持创建文本类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 文本类数据集格式要求文件内容文件格式文件要求文档 txt、mobi、epub、docx、pdf 单个文件大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求

总条数： 223

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts Studio大模型开发平台使用流程 - 盘古大模型 PanguLargeModels

盘古NLP大模型能力与规格 - 盘古大模型 PanguLargeModels

责任共担 - 盘古大模型 PanguLargeModels

导入数据至盘古平台 - 盘古大模型 PanguLargeModels

数据工程介绍 - 盘古大模型 PanguLargeModels

什么是盘古大模型 - 盘古大模型 PanguLargeModels

盘古大模型空间资产介绍 - 盘古大模型 PanguLargeModels

管理盘古数据资产 - 盘古大模型 PanguLargeModels

权限管理 - 盘古大模型 PanguLargeModels

使用数据工程构建NLP大模型数据集 - 盘古大模型 PanguLargeModels

管理发布后的数据集 - 盘古大模型 PanguLargeModels

基本概念 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

打造政务智能问答助手 - 盘古大模型 PanguLargeModels

空间管理 - 盘古大模型 PanguLargeModels

模型开发 - 盘古大模型 PanguLargeModels

管理加工后的数据集 - 盘古大模型 PanguLargeModels

知识库介绍 - 盘古大模型 PanguLargeModels

资源到期了如何续费 - 盘古大模型 PanguLargeModels

文本类数据集格式要求 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线