搜索_华为云

场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.909版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。推理部署使用的服务框架是vLLM。vLLM支持v0.6.0版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
使用SmoothQuant量化 - AI开发平台ModelArts

m_tools/AutoSmoothQuant/autosmoothquant/examples 配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。 export ASCEND_RT_VISIBLE_DEVICES=0,1 通过命令npu-smi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

m_tools/AutoSmoothQuant/autosmoothquant/examples 配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。 export ASCEND_RT_VISIBLE_DEVICES=0,1 通过命令npu-smi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

m_tools/AutoSmoothQuant/autosmoothquant/examples 配置需要使用的NPU卡，例如：实际使用的是第1张和第2张卡，此处填写为“0,1”，以此类推。 export ASCEND_RT_VISIBLE_DEVICES=0,1 通过命令npu-smi

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
pipeline代码适配 - AI开发平台ModelArts

pipeline代码适配 onnx pipeline的主要作用是将onnx模型进行一系列编排，并在onnx Runtime上按照编排顺序执行。因此，需要将转换得到的mindir模型按照相同的逻辑进行编排，并在MindSpore Lite上执行。只需要将原始onnx的pipelin

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
创建模型不同方式的场景介绍 - AI开发平台ModelArts

自动学习项目中，在完成模型部署后，其生成的模型也将自动上传至模型列表中。但是自动学习生成的模型无法下载，只能用于部署上线。创建模型、管理模型版本等功能目前是免费开放给所有用户，使用此功能不会产生费用。创建模型的几种场景从训练作业中导入模型文件创建模型：在ModelArts中创建训练作业，并完

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

Notebook中上传下载OBS文件使用OBS客户端上传文件的操作指导：上传文件方法一：在Notebook中通过Moxing上传下载OBS文件 MoXing是ModelArts自研的分布式训练加速框架，构建于开源的深度学习引擎TensorFlow、PyTorch等之上，使用MoXing API可让模型代码的编写更加简单、高效。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

其中，加粗的斜体字段需要根据实际值填写： ma_endpoint为ModelArts的终端节点。 project_id为用户的项目ID。 “X-Auth-Token”的值是上一步获取到的Token值。返回状态码“200”，响应Body如下所示： { "total_count": 2, "flavors":

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
moondream2基于Lite Server适配PyTorch NPU推理指导 - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查docker是否安装。 docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

Standard策略权限管理章节。更多关于创建自定义策略操作和参数说明请参见创建自定义策略。如果一个自定义策略中包含多个服务的授权语句，这些服务必须是同一属性，即都是全局级服务或者项目级服务。由于OBS为全局服务，ModelArts为项目级服务，所以需要创建两条“作用范围”别为“全局级服

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
Notebook专属预置镜像列表 - AI开发平台ModelArts

e所对应的Conda环境如下。用户可以根据是否使用AI引擎Mindspore参与功能调试，选择不同的Conda环境。 Notebook：是一款Web应用，用户能够在界面编写代码，并且将代码、数学方程和可视化内容组合到一个文档中。 JupyterLab插件：插件包括规格切换，分享案例到AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
使用CES监控Lite Server资源 - AI开发平台ModelArts

LspciCardNotFound 重要一般是由于NPU掉卡联系运维人员协助处理 NPU卡无法正常使用 Snt3P 300IDuo Snt9B Snt9C NPU: 温度超过阈值 TemperatureOverUpperLimit 重要可能是由于DDR颗粒温度过高或过温软件预警暂

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源

总条数： 1072

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

场景介绍 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

创建模型不同方式的场景介绍 - AI开发平台ModelArts

如何在ModelArts的Notebook中上传下载OBS文件？ - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

moondream2基于Lite Server适配PyTorch NPU推理指导 - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

Notebook专属预置镜像列表 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线