搜索_华为云

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

量的要求较大，如果您的无监督文档量级过小，达不到预训练要求，您可以通过一些手段将其转换为有监督数据，再将转换后的领域知识与目标任务数据混合，使用微调的方式让模型学习。这里提供了一些将无监督数据转换为有监督数据的方案，供您参考：基于规则构建：您可以通过采用一些简单的规则来构建有监督数据。比如：

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类
创建多语言文本翻译插件 - 盘古大模型 PanguLargeModels

提前开通“文本翻译”服务。登录自然语言处理控制台，切换区域至华北-北京四，在“总览”页面下方开通“文本翻译”服务。图1 开通文本翻译服务操作流程创建多语言文本翻译插件的流程见表1。表1 创建多语言文本翻译插件流程操作步骤说明步骤1：获取文本翻译服务Token与调用地址本样例场景实现文本翻译服务Token与调用地址的获取。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > Agent应用实践 > 低代码构建多语言文本翻译工作流 > 附录
请求URI - 盘古大模型 PanguLargeModels

请求URI 服务的请求URI即API服务的终端地址，通过该地址与API进行通信和交互。 URI获取步骤如下：登录ModelArts Studio大模型开发平台。进入所需工作空间。获取请求URI。获取模型请求URI。若调用部署后的模型，可在左侧导航栏中选择“模型开发 >

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
包年/包月和按需计费模式是否支持互相切换 - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式是否支持互相切换包年/包月和按需计费模式使用周期内不支持主动切换，需要联系客服进行变更配置。盘古大模型的资源与资产计费模式不同，详见计费模式。父主题：计费FAQ

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明 > 计费FAQ
文本类加工算子介绍 - 盘古大模型 PanguLargeModels

从电子书中提取出所有文本内容。数据转换个人数据脱敏对文本中的手机号码、身份证件、邮箱地址、url链接、国内车牌号、IP地址、MAC地址、IMEI、护照、车架号等个人敏感信息进行数据脱敏，或直接删除敏感信息。中文简繁转换将中文简体和中文繁体进行转换。符号标准化查找文本中携带的非标准化符号进行标准化、统一化转换。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

型消除语义歧义性，识别用户查询意图，并直接生成支持下游操作的结构化JSON信息。大模型的NL2JSON能力可以从自然语言输入抽取关键信息并转换为JSON格式输出，以供下游操作，从而满足该场景下客户需求。金融场景下，NL2JSON能力可以有效消除用户语义歧义性，提高数据处理的灵活

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 从基模型训练出行业大模型
变更计费模式 - 盘古大模型 PanguLargeModels

变更计费模式盘古大模型的模型订阅、数据托管单元、推理单元默认采用包周期计费，训练单元、数据智算单元、数据通算单元采用包周期和按需计费两种方式。盘古大模型使用周期内不支持变更配置。

帮助中心 > 盘古大模型 PanguLargeModels > 计费说明
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

选择合适的模型，从而提高模型的整体效果，详见表1。此外，不同类型的NLP大模型在训练过程中，读取中文、英文内容时，字符长度转换为Token长度的转换比有所不同，详见表2。表1 不同系列NLP大模型对处理文本的长度差异模型名称可处理最大上下文长度可处理最大输出长度说明

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
状态码 - 盘古大模型 PanguLargeModels

这个临时响应用来通知客户端，它的部分请求已经被服务器接收，且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。例如，切换到HTTPS的新版本协议。 200 OK 服务器已成功处理了请求。 201 Created 创建类的请求完全成功。 202

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
图片类加工算子介绍 - 盘古大模型 PanguLargeModels

图片类加工算子介绍数据加工算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台提供了图文类、图片类加工算子，算子能力清单见表1。表1 图片类加工算子能力清单算子分类

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍
错误码 - 盘古大模型 PanguLargeModels

decrypt token fail：token解析失败。 token expires：token过期。 verify aksk signature fail：AK/SK认证失败。 x-auth-token not found：未找到x-auth-token参数。 token解析

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
图片类数据集格式要求 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 ModelArts Studio大模型开发平台支持创建图片类数据集，创建时可导入多种形式的数据，具体格式要求详见表1。表1 图片类数据集格式要求文件内容文件格式文件要求仅图片 tar、图片目录图片：支持jpg、jpeg、png、bmp类型。 ta

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

去除重复数据：确保数据集中每条数据的唯一性。填补缺失值：填充数据中的缺失部分，常用方法包括均值填充、中位数填充或删除缺失数据。数据标准化：将数据转换为统一的格式或范围，特别是在处理数值型数据时（如归一化或标准化）。去噪处理：去除无关或异常值，减少对模型训练的干扰。数据预处理的目的是

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
大模型开发基本概念 - 盘古大模型 PanguLargeModels

大模型的计量单位token指的是什么令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个to

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 基础知识
数据工程 - 盘古大模型 PanguLargeModels

保不同业务场景下的数据获取需求得到满足。数据加工：平台提供强大的数据加工功能，可以对文本、视频、图片、气象类型的数据进行数据提取、过滤、转换、打标签和评分等加工处理。针对不同类型的数据集，平台提供了专用的清洗算子以及支持用户创建自定义算子实现个性化的数据清洗诉求。确保生成高质量

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 产品功能
创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

已部署服务：选择部署至ModelArts Studio平台的模型进行评测。外部服务：通过API的方式接入外部模型进行评测。选择外部服务时，需要填写外部模型的接口名称、接口地址、请求体、响应体等信息。请求体支持openai、tgi、自定义三种格式。openai格式即是由OpenAI公司开发并标准化的一种大模型请求格式；tgi格式即是Hugging

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 评测NLP大模型
创建插件 - 盘古大模型 PanguLargeModels

在“配置信息”页面，参照表1完成信息配置。表1 插件信息配置说明参数名称参数说明插件URL 插件服务的请求URL地址。 URL协议只支持HTTP和HTTPS。系统会校验URL地址是否为标准的URL格式。 URL对应的IP默认不应为内网，否则会导致注册失败。仅在非商用环境部署时，才允许

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用 > 创建与管理插件
创建边缘资源池 - 盘古大模型 PanguLargeModels

anongid=100,fsid=0) 172.xxx.0.0/24为集群内网IP网段（登录主控节点，使用hdactl info命令查看IP地址。比如查得IP地址为172.16.0.22，可配置为172.16.0.0/24网段）。其中， /var/docker/hilens：网盘根目录路径。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型资源池
管理盘古模型资产 - 盘古大模型 PanguLargeModels

本空间”页面，单击支持导出的模型名称，右上角的“导出模型”。在“导出模型”页面，选择需要导出的模型，应设置导出模型时对应的导出位置（OBS桶地址），添加从环境B中下载的用户证书。设置完成后单击“确定”导出模型。图2 导出模型导入其他局点盘古大模型导入盘古大模型前，请确保当前空间为该用户所创建的空间。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 管理盘古大模型空间资产
气象类加工算子介绍 - 盘古大模型 PanguLargeModels

平台支持气象类数据集的加工操作，气象类加工算子能力清单见表1。表1 气象类加工算子能力清单算子分类算子名称算子描述科学计算气象预处理将二进制格式的气象数据文件转换成结构化JSON数据。父主题：数据集加工算子介绍

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集加工算子介绍

总条数： 73

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

无监督领域知识数据量无法支持增量预训练，如何进行模型学习 - 盘古大模型 PanguLargeModels

创建多语言文本翻译插件 - 盘古大模型 PanguLargeModels

请求URI - 盘古大模型 PanguLargeModels

包年/包月和按需计费模式是否支持互相切换 - 盘古大模型 PanguLargeModels

文本类加工算子介绍 - 盘古大模型 PanguLargeModels

基于NL2JSON助力金融精细化运营 - 盘古大模型 PanguLargeModels

变更计费模式 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

图片类加工算子介绍 - 盘古大模型 PanguLargeModels

错误码 - 盘古大模型 PanguLargeModels

图片类数据集格式要求 - 盘古大模型 PanguLargeModels

大模型开发基本流程介绍 - 盘古大模型 PanguLargeModels

大模型开发基本概念 - 盘古大模型 PanguLargeModels

数据工程 - 盘古大模型 PanguLargeModels

创建NLP大模型评测任务 - 盘古大模型 PanguLargeModels

创建插件 - 盘古大模型 PanguLargeModels

创建边缘资源池 - 盘古大模型 PanguLargeModels

管理盘古模型资产 - 盘古大模型 PanguLargeModels

气象类加工算子介绍 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线