搜索_华为云

管理模型资产、推理资产 - 盘古大模型 PanguLargeModels

推理资产不足，现有资源无法满足同时部署多个模型时，可以扩容模型推理资产。在“平台管理 > 资产管理 > 模型推理资产”中，单击操作列“扩容”执行扩容操作。图4 扩容模型推理资产不同类型的模型在部署时，做占用的推理资产数量存在差异，部署模型时所占的推理资产数量与模型类型关系如下。表1

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 平台资源管理
Cache - 盘古大模型 PanguLargeModels

Cache Cache缓存是一种临时存储数据的方法，它可以把常用的数据保存在内存或者其他设备中，当需要访问这些数据时，无需再去原始的数据源查找，而是直接从缓存中获取，从而节省时间和资源。 Cache缓存有以下几种操作：初始化：指定缓存使用哪种存储方式，例如，使用内存型缓存可以设置为memory_cache

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Python SDK > Memory（记忆）
考察模型逻辑 - 盘古大模型 PanguLargeModels

可解释性。对于模型答案的反问如果模型给出了错误的答案，可以反问模型回答的逻辑，有时可以发现错误回答的根因，并基于此修正提示词。在反问时需要指明“上面的xxx”。例如：“为什么你认为上面的xxx是xxx类别？为什么上面的xxx不是xxx类别？”，否则模型会认为用户反问是个新问

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 进阶技巧
统计模型调用量 - 盘古大模型 PanguLargeModels

通过“服务管理”功能查看调用量：查看具体某个模型的调用总量、调用成功量、调用失败量，且可按时间进行筛选。通过“运营面板”功能查看调用量：查看全部模型访问总数、模型回复时的响应时长、兜底回复比例以及输入/输出token信息。通过“服务管理”功能查看调用量登录盘古大模型套件平台。在左侧导航栏中选择“服务管

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 调用盘古大模型
部署为在线服务 - 盘古大模型 PanguLargeModels

当部署一个实例时，占用0.125个推理单元。 32K版本：当部署一个实例时，占用0.125个推理单元。 128K版本：当部署一个实例时，占用1个推理单元。盘古-NLP-N2系列模型当部署一个实例时，占用0.5个推理单元。盘古-NLP-N4系列模型当部署一个实例时，占用1个推理单元。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型
模型支持的操作 - 盘古大模型 PanguLargeModels

模型支持的操作在选择和使用盘古大模型时，了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型评估、模型压缩和在线推理等方面的支持程度各不相同，开发者应根据自身需求选择合适的模型。以下是各个模型支持的具体操作：表1 模型支持的操作模型预训练微调模型评估模型压缩

 帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍 > 模型能力与规格
调用盘古大模型API - 盘古大模型 PanguLargeModels

单击Postman界面的“Send”按钮，发送请求。当接口返回状态为200时，表示盘古API调用成功，并可在Postman中看到接口的返回信息。图10 获取盘古API调用结果使用Postman调用API时，如果出现SSL证书无效相关的报错，如“self signed certi

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门
常见问题 - 盘古大模型 PanguLargeModels

常见问题使用java sdk出现第三方库冲突当出现第三方库冲突的时，如Jackson，okhttp3版本冲突等。可以引入如下bundle包(3.0.40-rc版本后)，该包包含所有支持的服务和重定向了SDK依赖的第三方软件，避免和业务自身依赖的库产生冲突： <dependency>

帮助中心 > 盘古大模型 PanguLargeModels > SDK参考
获取项目ID - 盘古大模型 PanguLargeModels

、账号ID、IAM用户名和IAM用户ID。在调用盘古API时，获取的项目id需要与盘古服务部署区域一致，例如盘古大模型当前部署在“西南-贵阳一”区域，需要获取与贵阳一区域的对应的项目id。图2 获取项目ID 多项目时，展开“所属区域”，从“项目ID”列获取子项目ID。调用API获取项目ID

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 附录
打基础 - 盘古大模型 PanguLargeModels

打基础先制定一个能够明确表达主题的提示词（若模型训练时包含相似任务，可参考模型训练使用的提示词），再由简至繁，逐步增加细节和说明。打好基础是后续提示词优化的前提，基础提示词生成效果差，优化只会事倍功半。例如，文学创作类可以使用“请创作一个关于{故事主题}的故事”，邮件写作类可

 帮助中心 > 盘古大模型 PanguLargeModels > 最佳实践 > 提示词写作实践 > 常用方法论
压缩盘古大模型 - 盘古大模型 PanguLargeModels

N2基础功能模型、N4基础功能模型、经有监督微调训练以及RLHF训练后的N2、N4模型可以通过模型压缩技术在保持相同QPS目标的情况下，降低推理时的显存占用。采用INT8的压缩方式，INT8量化可以显著减小模型的存储大小与降低功耗，并提高计算速度。模型经过量化压缩后，不支持评估操作，但可以进行部署操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
启用模型内容审核 - 盘古大模型 PanguLargeModels

核，帮助客户降低业务违规风险。授权使用华为云内容审核，有效拦截大模型输入输出的有害信息，保障模型调用安全。授权后，在调用盘古大模型能力时，模型的输入和输出将分别调用一次内容审核服务，该服务为付费项，用户可按需购买。若不使用，您也可以自行对接第三方内容审核服务。关于大模型生成

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 调用盘古大模型
撰写提示词 - 盘古大模型 PanguLargeModels

撰写提示词提示词是用来引导模型生成的一段文本。撰写的提示词应该包含任务或领域的关键信息，如主题、风格和格式等。撰写提示词时，可以设置提示词变量，即在提示词中通过添加占位符{{ }}标识，表示一些动态的信息，让模型根据不同的情况生成不同的文本，增加模型的灵活性和适应性。例如，将

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 提示词工程 > 撰写提示词
使用“能力调测”调用模型 - 盘古大模型 PanguLargeModels

能力调测通过图形化问答界面，提供了快速访问盘古大模型能力的入口。用户可以通过在“能力调测”页面选择调用基模型或训练后的模型。训练后的模型需要“在线部署”且状态为“运行中”时，才可以使用本章节提供的方法进行调测，具体步骤请参见部署为在线服务。文本补全：给定一个提示和一些参数，模型会根据这些信息生成一个或多个预测

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 调用盘古大模型
创建模型评估数据集 - 盘古大模型 PanguLargeModels

创建模型评估数据集在收集评估数据集时，应确保数据集的独立性和随机性，并使其能够代表现实世界的样本数据，以避免对评估结果产生偏差。对评估数据集进行分析，可以帮助了解模型在不同情境下的表现，从而得到模型的优化方向。在“数据工程 > 数据管理”中创建“评测”类型的数据集作为评估数据集，数据集创建完成后需要执行发布操作。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 评估盘古大模型
运行Agent - 盘古大模型 PanguLargeModels

09:00的A01已预定成功 - 步骤3 答复:"已为您预定 A01会议室，时间为2024年5月8日早上8点到9点。 " 多轮执行增强上述的例子中实际运行时只提供给模型多轮的对话，并没有提供工具执行的过程，有概率会出现模型不实际调用工具的情况。为了让大模型的效果更好，可以传入agentSession。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 盘古应用开发SDK > Java SDK > Agent（智能代理）
开通盘古大模型服务 - 盘古大模型 PanguLargeModels

保障模型调用安全。 NLP模型在流式输出时，同样支持内容审核。特别是模型生成超长内容时，通过实时审核模型生成的内容片段，可以有效降低首token的审核时延，同时确保用户看到的内容是经过严格审核的。图3 大模型内容审核购买内容审核套餐包时，如果使用“文本补全”和“多轮对话”功能，需要选择“文本内容审核”套餐。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备工作
创建一个新的数据集 - 盘古大模型 PanguLargeModels

数据集路径说明数据集训练类型数据集所在OBS路径自监督训练数据集创建数据集时，需要指定数据文件所在的文件夹。有监督微调数据集创建数据集时，可以指定数据文件或者数据文件所在的文件夹。评测数据集创建数据集时，可以指定数据文件或者数据文件所在的文件夹。基本信息填写数据集名称与描述，选择行业、语言和数据标签。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 准备盘古大模型训练数据集
使用API调用模型 - 盘古大模型 PanguLargeModels

单击Postman界面的“Send”按钮，发送请求。当接口返回状态为200时，表示盘古API调用成功，并可在Postman中看到接口的返回信息。图10 获取盘古API调用结果使用Postman调用API时，如果出现SSL证书无效相关的报错，如“self signed certi

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 调用盘古大模型
认证鉴权 - 盘古大模型 PanguLargeModels

权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。 Token的有效期为24小时，需要使用一个Token鉴权时，可以先缓存起来，避免频繁调用。如果您的华为云账号已升级为华为账号，将不支持获取账号Token。建议为您自己

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API

总条数： 98

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理模型资产、推理资产 - 盘古大模型 PanguLargeModels

Cache - 盘古大模型 PanguLargeModels

考察模型逻辑 - 盘古大模型 PanguLargeModels

统计模型调用量 - 盘古大模型 PanguLargeModels

部署为在线服务 - 盘古大模型 PanguLargeModels

模型支持的操作 - 盘古大模型 PanguLargeModels

调用盘古大模型API - 盘古大模型 PanguLargeModels

常见问题 - 盘古大模型 PanguLargeModels

获取项目ID - 盘古大模型 PanguLargeModels

打基础 - 盘古大模型 PanguLargeModels

压缩盘古大模型 - 盘古大模型 PanguLargeModels

启用模型内容审核 - 盘古大模型 PanguLargeModels

撰写提示词 - 盘古大模型 PanguLargeModels

使用“能力调测”调用模型 - 盘古大模型 PanguLargeModels

创建模型评估数据集 - 盘古大模型 PanguLargeModels

运行Agent - 盘古大模型 PanguLargeModels

开通盘古大模型服务 - 盘古大模型 PanguLargeModels

创建一个新的数据集 - 盘古大模型 PanguLargeModels

使用API调用模型 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线