搜索_华为云

搭建边缘服务器集群 - 盘古大模型 PanguLargeModels

node-type是集群节点类型。其中，worker表示工作节点，controller表示主控节点。在服务器执行如下命令，判断docker是否安装成功。 systemctl status docker 在服务器执行如下命令，判断edge agent是否安装成功。 hdactl info 配置hda

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
获取模型调用API地址 - 盘古大模型 PanguLargeModels

在弹窗中可获取对应模型的API请求地址。其中，路径选中部分即为模型的部署ID（deployment_id）。图3 获取API请求地址父主题：附录

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
使用API调用模型 - 盘古大模型 PanguLargeModels

使用多语言（Java/Python/Go）调用API 获取API请求地址。在“服务管理”页面，单击所需API的“查看详情”按钮。图11 服务管理在“服务列表”中选择需要调用的模型，单击操作栏中的“调用路径”，复制对应模型的API请求地址。图12 获取API请求地址获取AK/SK。在使用盘古SDK时，需要使用AK/SK进行身份验证。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 调用盘古大模型
调用盘古大模型API - 盘古大模型 PanguLargeModels

章节提供的方法进行调用。本章节将介绍如何使用Postman调用API，仅供测试使用。前提条件使用API调用模型前，请先完成盘古大模型服务订购和开通操作。使用Postman调用API 获取API请求地址。在“服务管理”页面，单击所需API的“查看详情”按钮。图1 服务管理

 帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
状态码 - 盘古大模型 PanguLargeModels

Failed 未满足前提条件，服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
终端节点 - 盘古大模型 PanguLargeModels

终端节点终端节点（endpoint）即API服务的终端地址，通过该地址与API进行通信和交互。获取步骤如下：登录盘古大模型套件平台。在左侧导航栏中选择“服务管理”，在相应服务的操作列单击“查看详情”，可在服务列表中申请需要开通的服务。图1 服务管理图2 申请开通服务在“概览

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

一个与目标任务同属的问题，回答的结果却不理想。这种情况可能是由于以下几个原因导致的，建议您依次排查：测试集质量：请检查测试集的目标任务和分布与实际场景是否一致，质量较差的测试集无法反映模型的真实结果。数据质量：请检查训练数据的质量，若训练样本和目标任务不一致或者分布差异较大，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
边缘服务部署流程 - 盘古大模型 PanguLargeModels

边缘服务部署流程边缘部署是指将模型部署到用户的边缘设备上。这些设备通常是用户自行采购的服务器，通过ModelArts服务纳管为边缘资源池。然后利用盘古大模型服务将算法部署到这些边缘资源池中。图1 边缘资源池创建步骤当前仅支持预置模型（盘古-NLP-N2-基础功能模型）和基于

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
调用AI助手API - 盘古大模型 PanguLargeModels

调用AI助手API 获取AI助手API调用地址登录盘古大模型套件平台。左侧导航栏选择“应用开发 > AI助手”，选择需要运行的AI助手，单击“查看”。图1 查看AI助手在详情页面，AI助手API调用地址。图2 获取调用地址获取Token 本示例中，通过使用Postman软件获取Token。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > AI助手
如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

训练效果，确认训练过程是否出现了过拟合或欠拟合等异常情况。模型评估：使用平台的“模型评估”功能，“模型评估”将对您之前上传的测试集进行评估。通过查看测试集样本的PPL、BLEU和ROUGE等指标，进行横向（相同训练数据+不同规格的通用模型）或纵向（不同训练数据训练的多个模型版本）对比来判断训练过程是否出现了问题。

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

数据批量大小 8 >=1 数据集进行分批读取训练，设定每个批次数据的大小。一般来说，批大小越大，训练速度越快，但会占用更多的内存资源，且可能导致收敛困难或过拟合。批大小越小，训练速度越慢，但会减少内存消耗，且可能提高泛化能力。因此，批大小需要根据数据集的规模和特点，以及模型的复杂度

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
创建有监督训练任务 - 盘古大模型 PanguLargeModels

数据批量大小 8 >=1 数据集进行分批读取训练，设定每个批次数据的大小。一般来说，批大小越大，训练速度越快，但会占用更多的内存资源，且可能导致收敛困难或过拟合。批大小越小，训练速度越慢，但会减少内存消耗，且可能提高泛化能力。因此，批大小需要根据数据集的规模和特点，以及模型的复杂度

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 训练盘古大模型 > 创建训练任务
压缩盘古大模型 - 盘古大模型 PanguLargeModels

在保持相同QPS目标的情况下，降低推理时的显存占用。采用INT8的压缩方式，INT8量化可以显著减小模型的存储大小与降低功耗，并提高计算速度。模型经过量化压缩后，不支持评估操作，但可以进行部署操作。创建模型压缩任务登录盘古大模型套件平台。在左侧导航栏中选择“模型开发 >

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
构造请求 - 盘古大模型 PanguLargeModels

请求什么类型的操作。 GET：请求服务器返回指定资源。 PUT：请求服务器更新指定资源。 POST：请求服务器新增资源或执行特殊操作。 DELETE：请求服务器删除指定资源，如删除对象等。 HEAD：请求服务器资源头部。 PATCH：请求服务器更新资源的部分内容。当资源不存在的时

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
产品优势 - 盘古大模型 PanguLargeModels

成文章、撰写报告，还是设计广告文案，盘古大模型都能根据输入需求灵活调整，生成符合预期的高质量内容。推理速度快盘古大模型采用了高效的深度学习架构和优化算法，显著提升了推理速度。在处理请求时，模型能够更快地生成结果，减少等待时间，从而提升用户体验。这种快速的推理能力使盘古大模型适

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
部署为边缘服务 - 盘古大模型 PanguLargeModels

部署为边缘服务边缘服务部署流程边缘部署准备工作注册边缘资源池节点搭建边缘服务器集群安装Ascend插件订购盘古边缘部署服务部署边缘模型调用边缘模型父主题：部署盘古大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型
如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

数据批量大小是指对数据集进行分批读取训练时，所设定的每个批次数据大小。批量大小越大，训练速度越快，但是也会占用更多的内存资源，并且可能导致收敛困难或者过拟合；批量大小越小，内存消耗越小，但是收敛速度会变慢，同时模型更容易受到数据噪声的影响，从而导致模型收敛困难。您可根据数据和模型的

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 典型训练问题和优化策略
理解底层任务 - 盘古大模型 PanguLargeModels

外部知识。例如，在构造泛化问题的任务中，需要基于原问题改写为相同含义的问题，而不是生成相似的问题。当提示词使用“请生成10个跟“手机银行怎么转账”相似的问题”时，模型会认为实体/关键词/场景一致则是相似（在这个例子里实体为手机银行），而不是任务需要的语义级别的相同含义，所以输出内容会发散。

帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
Memory（记忆） - 盘古大模型 PanguLargeModels

对话、搜索增强等场景。 Memory（记忆）支持多种不同的存储方式和功能。 Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。缓存可以根据不同的存储方式进行初始化、更新、查找和清理操作。缓存还可以支持语义匹配和查询，通过向量和相似度的计算，实现对数据的语义理解和检索。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK
Memory（记忆） - 盘古大模型 PanguLargeModels

对话、搜索增强等场景。 Memory（记忆）支持多种不同的存储方式和功能。 Cache缓存：是一种临时存储数据的方法，它可以提高数据的访问速度和效率。缓存可以根据不同的存储方式进行初始化、更新、查找和清理操作。缓存还可以支持语义匹配和查询，通过向量和相似度的计算，实现对数据的语义理解和检索。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK

总条数： 44

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

搭建边缘服务器集群 - 盘古大模型 PanguLargeModels

获取模型调用API地址 - 盘古大模型 PanguLargeModels

使用API调用模型 - 盘古大模型 PanguLargeModels

调用盘古大模型API - 盘古大模型 PanguLargeModels

状态码 - 盘古大模型 PanguLargeModels

终端节点 - 盘古大模型 PanguLargeModels

为什么微调后的模型，评估结果很好，但实际场景表现却很差 - 盘古大模型 PanguLargeModels

边缘服务部署流程 - 盘古大模型 PanguLargeModels

调用AI助手API - 盘古大模型 PanguLargeModels

如何评估微调后的模型是否正常 - 盘古大模型 PanguLargeModels

创建自监督微调训练任务 - 盘古大模型 PanguLargeModels

创建有监督训练任务 - 盘古大模型 PanguLargeModels

压缩盘古大模型 - 盘古大模型 PanguLargeModels

构造请求 - 盘古大模型 PanguLargeModels

产品优势 - 盘古大模型 PanguLargeModels

部署为边缘服务 - 盘古大模型 PanguLargeModels

如何调整训练参数，使模型效果最优 - 盘古大模型 PanguLargeModels

理解底层任务 - 盘古大模型 PanguLargeModels

Memory（记忆） - 盘古大模型 PanguLargeModels

Memory（记忆） - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线