搜索_华为云

在推理生产环境中部署推理服务 - AI开发平台ModelArts

若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。 Step3 部署在线服务将Step2 部署模型中创建的AI应用部署为一个在线服务，用于推理调用。在ModelArts控制台，单击“模型部署 > 在线服务 > 部署”，开始部署在线服务。设置部署服务名称，选择Step2 部署模型中创建的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
执行纵向联邦模型训练作业 - 可信智能计算服务 TICS

执行纵向联邦模型训练作业成功 { "job_instance_id" : "7b0df147d6464ef2877b22f6d964d274" } 状态码状态码描述 200 执行纵向联邦模型训练作业成功 401 操作无权限 500 内部服务器错误父主题：可信联邦学习作业管理

 帮助中心 > 可信智能计算服务 TICS > API参考 > 计算节点API > 可信联邦学习作业管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

文件存放目录。投机草稿模型为与--model入参同系列，但是权重参数远小于--model指定的模型。若未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。若未使用投机推理功能，则无需配置。参数--num-spe

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

文件存放目录。投机草稿模型为与--model入参同系列，但是权重参数远小于--model指定的模型。若未使用投机推理功能，则无需配置。 --num-speculative-tokens：投机推理小模型每次推理的token数。若未使用投机推理功能，则无需配置。参数--num-spe

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
概述 - 盘古大模型 PanguLargeModels

操作指导 NLP大模型-文本对话基于对话问答功能，用户可以与模型进行自然而流畅的对话和交流。文本对话科学计算大模型-气象/降水模型支持创建推理作业并查询推理作业详情。气象/降水模型科学计算大模型-海洋模型支持创建推理作业并查询推理作业详情。海洋模型 Agent-调用应用

 帮助中心 > 盘古大模型 PanguLargeModels > API参考 > 使用前必读
资产模型 - IoT数据分析 IoTA
资产模型 - IoT数据分析 IoTA

资产模型创建资产模型获取资产模型列表获取资产模型详情修改资产模型删除资产模型父主题： API列表

 帮助中心 > IoT数据分析 IoTA > API参考 > API列表
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

--base-path 大模型权重地址 --draft-path 小模型权重地址 --base-weight-name 大模型包含lm_head的权重文件名 --draft-weight-name 小模型权重文件名具体可参考 8 eagle 投机小模型训练步骤五：训练生成权重转换成可以支持vLLM推理的格式

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
通过OBS创建模型时，构建日志中提示pip下载包失败 - AI开发平台ModelArts

则建议使用whl包进行安装（将待安装的whl包放到模型所在的OBS目录下）。查看待安装包的安装限制和前置依赖等，排查是否满足相关要求。如果包有依赖关系，请参考导入模型时，模型配置文件中的安装包依赖参数如何编写？章节配置包的先后依赖关系。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
模型训练 - 网络智能体
模型训练 - 网络智能体

参数设置，重新选择使用的模型，或关闭特征搜索。其中“排行榜”展示所有训练出的模型列表，支持对模型进行如下操作：单击模型所在行对应“操作”列的“详情”，查看模型超参取值和模型评分结果。单击模型所在行对应“操作”列的“预测”，在新增的“AutoML模型预测”内容中，选择测试数据

 帮助中心 > 网络智能体 > 模型训练服务 > 用户指南 > 特征工程 > JupyterLab开发平台
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

运行代码及模型需安装的依赖包，默认为空。如果已在模型配置文件中配置dependencies信息时，则可不填，后台自动从配置文件的dependencies字段中读取需要安装的依赖包。 apis 否 String 模型提供的推理接口列表，默认为空。如果已在模型配置文件中配置apis信

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
使用API调用NLP大模型 - 盘古大模型 PanguLargeModels

Studio大模型开发平台，在“我的空间”模块，单击进入所需空间。获取调用路径。在左侧导航栏中选择“模型开发 > 模型部署”。获取已部署模型的调用路径。在“我的服务”页签，单击状态为“运行中”的模型名称，在“详情”页签，可获取模型调用路径，如图1。图1 获取已部署模型的调用路径

 帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 调用NLP大模型
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Step6 推理服务的高阶配置（可选）如需开启以下高阶配置，请在Step3 配置NPU环境时增加需要开启的高阶配置参数。词表切分在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
附录：rank_table_file.json文件 - AI开发平台ModelArts

"status": "completed", "version": "1.0" } 父主题： DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重准备BF16权重准备W8A8权重父主题： DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
功能介绍 - 华为HiLens
功能介绍 - 华为HiLens

统一的API接口，支持多种深度学习开发框架。提供模型训练、开发、调试、部署、管理一站式服务，无缝对接用户设备。在云侧模型管理中导入ModelArts训练出的模型，也可导入用户线下开发的自定义模型。技能开发完成后可发布到AI Gallery或直接部署到端侧设备。对接AI开发

 帮助中心 > 华为HiLens > 产品介绍
NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

NLP大模型训练流程与选择建议 NLP大模型训练流程介绍 NLP大模型的训练分为两个关键阶段：预训练和微调。预训练阶段：在这一阶段，模型通过学习大规模通用数据集来掌握语言的基本模式和语义。这一过程为模型提供了处理各种语言任务的基础，如阅读理解、文本生成和情感分析，但它还未能针对特定任务进行优化。

帮助中心 > 盘古大模型 PanguLargeModels > 用户指南 > 开发盘古NLP大模型 > 训练NLP大模型
开发模型 - 华为HiLens
开发模型 - 华为HiLens

开发模型前提条件目前，HiLens Kit的AI芯片支持运行“.om”模型，“.om”模型可以通过TensorFlow或Caffe模型转换而来，但“.om”模型并不支持TensorFlow和Caffe全部的算子，所以在开发模型的时候开发者需要用“.om”模型支持的算子，才能把

 帮助中心 > 华为HiLens > 用户指南（基础版控制台） > 开发环境HiLens Studio > 管理模型
模型仓库 - 网络智能体
模型仓库 - 网络智能体

模型仓库在菜单栏中，选择“模型仓库”。进入“模型仓库”界面。界面以列表的形式，展示了当前租户下面已成功创建推理服务的模型包列表和模型包详细信息，如图1所示。图1 模型仓库界面说明如表1所示。表1 模型仓库界面说明区域参数参数说明 1 支持通过模型包名称快速检索模型包。

帮助中心 > 网络智能体 > 模型训练服务 > 用户指南 > 云端推理框架
模型加密（可选） - 华为HiLens
模型加密（可选） - 华为HiLens

cipherModelfile 其中“model_file”为待加密模型文件，“cipher_file”为加密之后的模型文件。接口调用和未加密模型一样调用接口，详情请见：创建模型实例模型推理示例-模型管理父主题：模型管理模块

 帮助中心 > 华为HiLens > 开发指南 > 模型管理模块

总条数： 10000

上一页
1
...
11
12
13
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在推理生产环境中部署推理服务 - AI开发平台ModelArts

执行纵向联邦模型训练作业 - 可信智能计算服务 TICS

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

概述 - 盘古大模型 PanguLargeModels

资产模型 - IoT数据分析 IoTA

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

通过OBS创建模型时，构建日志中提示pip下载包失败 - AI开发平台ModelArts

模型训练 - 网络智能体

模型调试 - AI开发平台ModelArts

使用API调用NLP大模型 - 盘古大模型 PanguLargeModels

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

附录：rank_table_file.json文件 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

功能介绍 - 华为HiLens

NLP大模型训练流程与选择建议 - 盘古大模型 PanguLargeModels

开发模型 - 华为HiLens

模型仓库 - 网络智能体

模型加密（可选） - 华为HiLens

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线