搜索_华为云

调用边缘模型 - 盘古大模型 PanguLargeModels

调用边缘模型调用边缘模型的步骤与使用“在线部署”调用模型的步骤相同，具体步骤请参考使用API调用模型。父主题：部署为边缘服务

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
部署边缘模型 - 盘古大模型 PanguLargeModels

部署边缘模型进入盘古大模型套件平台，进入“模型开发 > 模型部署 > 边缘部署”，单击右上角“部署”按钮。在创建部署页面选择模型与部署资产，选择部署方式为边缘部署，输入推理实例数（根据边缘资源池的实际资源选择），输入服务名称，单击“立即创建”。创建成功后，可在“模型部署 >

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
注册边缘资源池节点 - 盘古大模型 PanguLargeModels

注册边缘资源池节点进入ModelArts服务，选择所需空间。在左侧列表中单击“边缘资源池”，在“节点”页签中，单击“创建”。在“创建边缘节点”页面中，填写节点名称，配置AI加速卡与日志信息，单击“确定”。如果节点有npu设备需选择“AI加速卡 > Ascend”，并选择加速卡类型。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
订购盘古边缘部署服务 - 盘古大模型 PanguLargeModels

应用增强功能”。用户可根据需求自行选择功能模型，输入资源名称，类型选择“边缘部署”，输入需要订购的推理算力，单击“确认订单”。订购完成后，进入“平台管理 > 资产管理 > 模型推理资产”，可查看订购的边缘部署资产。父主题：部署为边缘服务

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
边缘部署准备工作 - 盘古大模型 PanguLargeModels

边缘部署准备工作本指南的边缘部署操作以largemodel集群为例，示例集群信息如下表。表1 示例集群信息集群名节点类型节点名规格备注 largemodel controller ecs-edge-XXXX 鲲鹏通用计算型|8vCPUs|29GiB|rc3.2xlarge

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
边缘服务部署流程 - 盘古大模型 PanguLargeModels

边缘服务部署流程边缘部署是指将模型部署到用户的边缘设备上。这些设备通常是用户自行采购的服务器，通过ModelArts服务纳管为边缘资源池。然后利用盘古大模型服务将算法部署到这些边缘资源池中。图1 边缘资源池创建步骤当前仅支持预置模型（盘古-NLP-N2-基础功能模型）和基于

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
搭建边缘服务器集群 - 盘古大模型 PanguLargeModels

进入ModelArts服务，选择所需空间。进入“边缘资源池 > 节点”，在当前设备节点操作列单击“激活”，节点状态将从“未激活”转为“已激活”。进入“边缘资源池 > 资源池”，单击“创建”。填写资源池名称，选择“ModelArts边缘节点”，在“主控节点”处单击“添加”，选择要添加的主控节点，单击“确定”。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
部署为边缘服务 - 盘古大模型 PanguLargeModels

部署为边缘服务边缘服务部署流程边缘部署准备工作注册边缘资源池节点搭建边缘服务器集群安装Ascend插件订购盘古边缘部署服务部署边缘模型调用边缘模型父主题：部署盘古大模型

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型
安装Ascend插件 - 盘古大模型 PanguLargeModels

dluserguide/clusterscheduling/dlug_scheduling_02_000001.html 父主题：部署为边缘服务

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 部署盘古大模型 > 部署为边缘服务
Token计算器 - 盘古大模型 PanguLargeModels

Token计算器功能介绍为了帮助用户更好地管理和优化Token消耗，平台提供了Token计算器工具。Token计算器可以帮助用户在模型推理前评估文本的Token数量，提供费用预估，并优化数据预处理策略。 URI POST /v1/{project_id}/deployment

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > API
部署盘古大模型 - 盘古大模型 PanguLargeModels

部署盘古大模型部署为在线服务部署为边缘服务

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南
获取Token消耗规则 - 盘古大模型 PanguLargeModels

理策略。使用Token计算器的步骤如下：登录盘古大模型套件平台。在“服务管理”页面，单击页面右上角“Token计算器”。在Token计算器中选择所需的模型，并输入文本内容后，单击“开始计算”即可统计输入文本的Token数量。图1 Token计算器预置模型和已经部署的模型可以使用Token计算器。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 平台资源管理
概述 - 盘古大模型 PanguLargeModels

概述盘古大模型整合华为云强大的计算和数据资源，将先进的AI算法集成在预训练大模型中，打造出具有深度语义理解与生成能力的人工智能大语言模型。可进行对话互动、回答问题、协助创作。华为云盘古大模型，以下功能支持API调用。表1 API清单 API 功能 NLP-文本补全给定一个

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
认证鉴权 - 盘古大模型 PanguLargeModels

AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。 Token认证 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。

帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 如何调用REST API
大模型的计量单位token指的是什么 - 盘古大模型 PanguLargeModels

令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个token：“over”、“weight”。在中文中，

帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
申请体验盘古大模型服务 - 盘古大模型 PanguLargeModels

申请体验盘古大模型服务盘古大模型为用户提供了五大模型的体验，包括NLP大模型、CV大模型、多模态大模型、预测大模型与科学计算大模型，用户可根据所需提交体验申请，申请通过后才可以体验盘古大模型功能。登录盘古大模型套件平台。在服务“总览”页面，单击“立即体验”，平台将跳转至盘古大模型体验申请页面。

帮助中心 > 盘古大模型 PanguLargeModels > 快速入门 > 体验盘古大模型功能
申请体验盘古大模型服务 - 盘古大模型 PanguLargeModels

申请体验盘古大模型服务盘古大模型为用户提供了五大模型的体验，包括NLP大模型、CV大模型、多模态大模型、预测大模型与科学计算大模型，用户可根据所需提交体验申请，申请通过后才可以体验盘古大模型功能。登录盘古大模型套件平台。在服务“总览”页面，单击“立即体验”，平台将跳转至盘古大模型体验申请页面。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 体验盘古大模型功能
计费说明 - 盘古大模型 PanguLargeModels

训练服务按实际消耗的Tokens数量计费，话单周期内的Tokens计算精确到1K Tokens，不足1K Tokens的部分舍去。专业大模型按需推理计费仅支持OP账号使用，推理服务按实际调用的Tokens数量计费，不足1K Tokens则小数点保留至后四位计算。计费模式盘古大模型的计费模式见表1。

帮助中心 > 盘古大模型 PanguLargeModels > 产品介绍
大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、审计和数据主权保护等机制。在训练和推理过程中，通过数据脱敏、隐私计算等技术手段识别并保护敏感数据，有效防止隐私泄露，保障个人隐私数据安全。内容安全：通过预训练和强化学习价值观提示（prompt），构建正向

 帮助中心 > 盘古大模型 PanguLargeModels > 常见问题 > 大模型概念类问题
压缩盘古大模型 - 盘古大模型 PanguLargeModels

技术在保持相同QPS目标的情况下，降低推理时的显存占用。采用INT8的压缩方式，INT8量化可以显著减小模型的存储大小与降低功耗，并提高计算速度。模型经过量化压缩后，不支持评估操作，但可以进行部署操作。创建模型压缩任务登录盘古大模型套件平台。在左侧导航栏中选择“模型开发

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南

总条数： 40

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调用边缘模型 - 盘古大模型 PanguLargeModels

部署边缘模型 - 盘古大模型 PanguLargeModels

注册边缘资源池节点 - 盘古大模型 PanguLargeModels

订购盘古边缘部署服务 - 盘古大模型 PanguLargeModels

边缘部署准备工作 - 盘古大模型 PanguLargeModels

边缘服务部署流程 - 盘古大模型 PanguLargeModels

搭建边缘服务器集群 - 盘古大模型 PanguLargeModels

部署为边缘服务 - 盘古大模型 PanguLargeModels

安装Ascend插件 - 盘古大模型 PanguLargeModels

Token计算器 - 盘古大模型 PanguLargeModels

部署盘古大模型 - 盘古大模型 PanguLargeModels

获取Token消耗规则 - 盘古大模型 PanguLargeModels

概述 - 盘古大模型 PanguLargeModels

认证鉴权 - 盘古大模型 PanguLargeModels

大模型的计量单位token指的是什么 - 盘古大模型 PanguLargeModels

申请体验盘古大模型服务 - 盘古大模型 PanguLargeModels

申请体验盘古大模型服务 - 盘古大模型 PanguLargeModels

计费说明 - 盘古大模型 PanguLargeModels

大模型的安全性需要从哪些方面展开评估和防护 - 盘古大模型 PanguLargeModels

压缩盘古大模型 - 盘古大模型 PanguLargeModels

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线