搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

n"。dtype类型不影响int8的scale系数的抽取和加载。 Step3 启动kv-cache-int8量化服务在使用OpenAI接口或vLLM接口启动推理服务时添加如下参数： --kv-cache-dtype int8 #只支持int8，表示kvint8量化 --qua

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
W8A16量化 - AI开发平台ModelArts
W8A16量化 - AI开发平台ModelArts

to("cpu") quantized_model.save_pretrained("CodeLlama-34b-hf") 步骤二：启动量化服务使用量化模型需要在NPU的机器上运行。在模型的保存目录中创建quant_config.json文件，bits必须设置为8，指定量化为i

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
ECS中构建新镜像 - AI开发平台ModelArts

口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图1 复制登录指令 Step3 修改并上传镜像 1. 在ECS服务器中输入登录指令后，使用下列示例命令将Standard镜像上传至SWR： docker tag ${dockerfile_image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

vServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
在ModelArts中部署模型时，为什么无法选择Ascend Snt3资源？ - AI开发平台ModelArts

6GB”资源为灰色，无法选择。解决方案：方法1：如果您希望使用公共资源池下的Ascend Snt3，可以等待其他用户释放，即其他使用Ascend Snt3芯片的服务停止，您即可选择此资源进行部署上线。方法2：如果专属资源池还有Ascend Snt3资源，您可以创建一个Ascend Snt3专属资源池使用。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询训练作业列表 - AI开发平台ModelArts

String 训练作业子任务名称。 exit_code Integer 训练作业子任务退出码。 message String 训练作业子任务错误消息。表9 RunningRecord 参数参数类型描述 start_at Integer 本次运行开始时间的unix时间戳，单位为秒(s)。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
ECS中构建新镜像（可选） - AI开发平台ModelArts

口，单击复制临时登录指令。在创建的ECS中粘贴临时登录指令，即可完成登录。图1 复制登录指令 Step3 修改并上传镜像 1. 在ECS服务器中输入登录指令后，使用下列示例命令将Standard镜像上传至SWR： docker tag ${dockerfile_image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

8*ascend-snt9b表示昇腾8卡。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。因此，在

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

0.5，表示固件版本为7.1.0.7.220，驱动版本为23.0.5。图2 查看专属池驱动创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数据、运行代码和模型文件，实现安全、高可靠和低成本的存储需求。因此

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

0.5，表示固件版本为7.1.0.7.220，驱动版本为23.0.5。图2 查看专属池驱动创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数据、运行代码和模型文件，实现安全、高可靠和低成本的存储需求。因此

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

0.5，表示固件版本为7.1.0.7.220，驱动版本为23.0.5。图2 查看专属池驱动创建OBS桶 ModelArts使用对象存储服务（Object Storage Service，简称OBS）存储输入输出数据、运行代码和模型文件，实现安全、高可靠和低成本的存储需求。因此

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
查询Notebook实例列表 - AI开发平台ModelArts

service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询所有Notebook实例列表 - AI开发平台ModelArts

service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。 size Long 镜像大小（单位KB）。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

容器镜像training:v1。 docker build . -t training:v1 将构建好的新镜像上传至SWR。登录容器镜像服务控制台，选择区域。单击右上角“创建组织”，输入组织名称完成组织创建。您可以自定义组织名称，本示例使用“deep-learning”，实际

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

--per-channel：权重量化方法，如果指定则为per-channel粒度量化，否则为per-tensor粒度量化。参考启动推理服务，启动推理服务时添加如下命令。 -q smoothquant 或者 --quantization smoothquant 使用llm-compre

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
创建图像分类项目 - AI开发平台ModelArts

数据校验：对您的数据集的数据进行校验，是否存在数据异常。图像分类：将发布好的数据集版本进行训练，生成对应的模型。模型注册：将训练后的结果注册到模型管理中。服务部署：将生成的模型部署为在线服务。快速查找创建好的项目在自动学习总览页，您可以通过搜索框，根据自动学习的属性类型（项目名称）快速搜索过滤到相应的工作流，可节省您的时间。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
迁移环境准备 - AI开发平台ModelArts

缺点：资源申请周期长，购买成本高，管理视角下资源使用效率较低。环境开通指导请参考DevServer资源开通；环境配置指导请参考Snt9B裸金属服务器环境配置指南。本文基于方式二的环境进行操作，请参考方式二中的环境开通和配置指导完成裸机和容器开发初始化配置。注意业务基础镜像选择Ascend+PyTorch镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建网络 - AI开发平台ModelArts
创建网络 - AI开发平台ModelArts

网段设置以后不能修改，避免与将要打通的VPC网段冲突。可能冲突的网段包括：用户的vpc网段容器网段（固定是172.16.0.0/16）服务网段（固定是10.247.0.0/16）确认无误后，单击“确定”。父主题：基本配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
发布免费算法 - AI开发平台ModelArts

布成功，则代码开放会失败。发布算法进入AI Gallery首页，选择“资产集市 > 算法”，进入算法页面。单击“发布”，弹出“选择云服务区域”，选择区域后单击“确定”跳转到“发布资产到AI Gallery”页面。在发布资产页面，填写相关信息，发布资产。如果是发布新资产。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享

总条数： 612

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

W8A16量化 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

在ModelArts中部署模型时，为什么无法选择Ascend Snt3资源？ - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

ECS中构建新镜像（可选） - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

创建图像分类项目 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

创建网络 - AI开发平台ModelArts

发布免费算法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线