搜索_华为云

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

Studio大模型开发平台中，使用数据工程创建盘古科学计算大模型数据集流程见表2。表2 盘古科学计算大模型数据集构建流程流程子流程说明操作指导导入数据至盘古平台创建导入任务将存储在OBS服务中的数据导入至平台统一管理，用于后续加工或发布操作。导入数据至盘古平台加工气象类数据集

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古科学计算大模型
文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持文本类数据集的清洗操作，分为数据提取、数据转换、数据过滤三类，文本类加工算子能力清单见表1。表1 文本类清洗算子能力清单算子分类算子名称

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
流通文本类数据集 - 盘古大模型 PanguLargeModels

流通文本类数据集数据流通是将单个数据集发布为特定格式的“发布数据集”的过程，用于后续模型训练等操作。单个文本类数据集支持发布的格式为：默认格式：平台默认的格式。在默认格式中，context和target是键值对。示例如下： {"context": "你好，请介绍自己", "target":

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 发布数据集 > 发布文本类数据集
获取模型部署ID - 盘古大模型 PanguLargeModels

获取模型部署ID 模型部署ID获取步骤如下：登录ModelArts Studio大模型开发平台。获取模型请求URI。若调用部署后的模型，可在左侧导航栏中选择“模型开发 > 模型部署”，在“我的服务”页签，模型部署列表单击模型名称，在“详情”页签中，可获取模型的部署ID。图1

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

数据清洗算子为用户提供了多种数据操作能力，包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息，并进行深度加工，以生成高质量的训练数据。平台支持视频类数据集的清洗操作，分为数据提取、数据过滤、数据打标三类，视频类加工算子能力清单见表1。表1 视频类清洗算子能力清单算子分类算子名称

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 加工数据集 > 数据集清洗算子介绍
撰写提示词 - 盘古大模型 PanguLargeModels

n限制等参数。模型参数的设置会影响模型的生成质量和多样性，因此需要根据不同的场景进行选择。登录ModelArts Studio大模型开发平台，进入所需空间。在左侧导航栏中选择“Agent 开发 > 提示词工程 > 提示词开发”。在工程任务列表页面，找到所需要操作的工程任务，单击该工程任务右侧“撰写”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 撰写提示词
请求URI - 盘古大模型 PanguLargeModels

服务的请求URI即API服务的终端地址，通过该地址与API进行通信和交互。 URI获取步骤如下：登录ModelArts Studio大模型开发平台。进入所需工作空间。获取请求URI。获取模型请求URI。若调用部署后的模型，可在左侧导航栏中选择“模型开发 > 模型部署”，在“我

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案工作流常见错误码与解决方案工作流常见报错及解决方案请详见表1。表1 工作流节点常见报错与解决方案模块名称错误码错误描述解决方案开始节点 101501 开始节点全局配置未传入值。开始节点错误，请联系客服解决。结束节点 101531

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型Agent应用
其他类数据集格式要求 - 盘古大模型 PanguLargeModels

其他类数据集格式要求除文本、图片、视频、气象、预测类数据集外，平台还支持导入其他类数据集，即用户训练模型时使用的自定义数据集。其他类数据集支持发布其他类数据集操作，不支持数据加工操作。其他类数据集要求单个文件大小不超过50GB，单个压缩包大小不超过50GB，文件数量最多1000个。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
什么是提示词工程 - 盘古大模型 PanguLargeModels

须的。提示词工程使用流程 ModelArts Studio大模型开发平台可以辅助用户进行提示词撰写、比较和评估等操作，并对提示词进行保存和管理。表1 功能说明功能说明提示词工程任务管理提示词工程平台以提示词工程任务为管理维度，一个任务代表一个场景或一个调优需求，在提示

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程
如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

估模型训练效果： Loss曲线：通过Loss曲线的变化趋势来评估训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

使用“能力调测”功能调用API接口 “能力调测”功能支持用户直接调用已部署的预置服务，使用步骤如下：登录ModelArts Studio大模型开发平台，进入所需空间。单击左侧“能力调测”，进入“文本对话”页签，选择服务与系统人设，参数设置为默认参数，在输入框输入问题，单击“生成”，模型将基于问题进行回答。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
审计 - 盘古大模型 PanguLargeModels

审计云审计服务（Cloud Trace Service，CTS）是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。用户开通云审计服务并创建、配置追踪器后，CTS可记录用户使用盘古的管理事件和数据事件用于审计。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 安全
预测类数据集格式要求 - 盘古大模型 PanguLargeModels

预测类数据集格式要求平台支持创建预测类数据集，创建时可导入时序数据、回归分类数据。时序数据：时序预测数据是一种按时间顺序排列的数据序列，用于预测未来事件或趋势，过去的数据会影响未来的预测。回归分类数据：回归分类数据包含多种预测因子（特征），用于预测连续变量的值，与时序数据不

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集 > 数据集格式要求
如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

推理参数（解码参数）是一组用于控制模型生成预测结果的参数，其可以用于控制模型生成结果的样式，如长度、随机性、创造性、多样性、准确性和丰富度等等。当前，平台支持的推理参数包括：温度、核采样以及话题重复度控制，如下提供了这些推理参数的建议值和说明，供您参考：表1 推理参数的建议和说明推理参数

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
创建提示词评估数据集 - 盘古大模型 PanguLargeModels

创建数据集时会对相关限制条件进行校验。数据参考格式如下：图1 数据参考格式图2 数据示例创建提示词评估数据集登录ModelArts Studio大模型开发平台，进入所需空间。在左侧导航栏中选择“Agent 开发 > 提示词工程 > 提示用例管理”，单击页面右上角“创建提示用例集”。图3 提示用例管理

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古大模型提示词工程 > 批量评估提示词效果
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

Token比（Token/英文单词） Token比（Token/汉字） N1 0.75 1.5 N2 0.88 1.24 N4 0.75 1.5 针对Token转换比，平台提供了Token计算器功能，可以根据您输入的文本计算Token数量，您可以通过以下方式使用该功能：在左侧导航栏选择“能力调测”，单击右下角“Token计算器”使用该功能。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

判断训练状态是否正常，通常可以通过观察训练过程中Loss（损失函数值）的变化趋势。损失函数是一种衡量模型预测结果和真实结果之间的差距的指标，正常情况下越小越好。您可以从平台的训练日志中获取到每一步的Loss，并绘制成Loss曲线，来观察其变化趋势。一般来说，一个正常的Loss曲线应该是单调递减的，即随着训练的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型微调训练类问题
应用场景 - 盘古大模型 PanguLargeModels

传统的AI开发模式需要对每种目标类别单独采集数据、训练模型，依赖专家经验进行算法参数调优，最后才能上线应用。基于ModelArts Studio平台开发工作流，将数据标注、模型训练、部署上线等繁杂的流程固化为一个流水线的步骤。通过大模型的能力，即使只有少量样本，也可以达到良好的模型泛化性和鲁棒性，解决碎片化AI需求的问题。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。 Verification failed. Please check the content format is consistent with the template requirements. 请检查创建数据集时使用的数据，与平台要求的文件内容格式是否一致。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 使用数据工程构建数据集

总条数： 247

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用数据工程构建科学计算大模型数据集 - 盘古大模型 PanguLargeModels

文本类清洗算子能力清单 - 盘古大模型 PanguLargeModels

流通文本类数据集 - 盘古大模型 PanguLargeModels

获取模型部署ID - 盘古大模型 PanguLargeModels

视频类清洗算子能力清单 - 盘古大模型 PanguLargeModels

撰写提示词 - 盘古大模型 PanguLargeModels

请求URI - 盘古大模型 PanguLargeModels

Agent开发常见报错与解决方案 - 盘古大模型 PanguLargeModels

其他类数据集格式要求 - 盘古大模型 PanguLargeModels

什么是提示词工程 - 盘古大模型 PanguLargeModels

如何评估微调后的盘古大模型是否正常 - 盘古大模型 PanguLargeModels

使用盘古预置NLP大模型进行文本对话 - 盘古大模型 PanguLargeModels

审计 - 盘古大模型 PanguLargeModels

预测类数据集格式要求 - 盘古大模型 PanguLargeModels

如何调整推理参数，使盘古大模型效果最优 - 盘古大模型 PanguLargeModels

创建提示词评估数据集 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

如何判断盘古大模型训练状态是否正常 - 盘古大模型 PanguLargeModels

应用场景 - 盘古大模型 PanguLargeModels

数据工程常见报错与解决方案 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线