搜索_华为云

使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用GPTQ量化 - AI开发平台ModelArts

PTQ量化工具GPTQ (huggingface.co)量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：开始之前，请确保安装了以下库： pip install auto-gptq pip install --upgrade accelerate optimum transformers

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

”实例。图1 选择指标源通过“全量指标”或“按普罗语句添加”方式选择一个或多个关注的指标。图2 添加指标关于更多指标浏览方法请参考华为云帮助中心“应用运维管理 AOM> 用户指南（2.0）> 指标浏览”。容器级别的指标介绍表1 容器级别的指标分类名称指标指标含义

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

ASCEND service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

Baichuan3-13B（PyTorch）基于DevServer训练指导推理参考文档：主流开源大模型（PyTorch）基于DevServer推理部署 AIGC，包名：ascendcloud-aigc Controlnet插件支持NPU推理（适配ComfyUI） Open-Clip模型昇腾适配

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
附录：训练常见问题 - AI开发平台ModelArts

duleNotFoundError: No module named 'tyro'" 错误截图：报错原因：未指定tyro依赖包版本，导致安装依赖为最新0.9.0版本导致与其他依赖冲突解决措施：任务前容器内更新'tyro'版本为0.8.14或以下版本 pip install tyro==0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
附录：训练常见问题 - AI开发平台ModelArts

duleNotFoundError: No module named 'tyro'" 错误截图：报错原因：未指定tyro依赖包版本，导致安装依赖为最新0.9.0版本导致与其他依赖冲突解决措施：任务前容器内更新'tyro'版本为0.8.14或以下版本 pip install tyro==0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
Standard资源池功能介绍 - AI开发平台ModelArts

发过程中选择此专属资源池。公共资源池：公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。用户下发训练作业、部署模型、使用开发环境实例等，均可以使用ModelArts提供的公共资源池完成，按照使用量计费，方便快捷。专属资源池和公共资源池的能力主要差异如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
查询可视化作业列表 - AI开发平台ModelArts

可视化作业的日志存储路径。 job_id Long 可视化作业的ID。 resource_id String 可视化作业的计费资源ID。请求示例如下以查询正在部署中的作业，按递增排序，显示第1页前10个可视化作业为例。 GET https://endpoint/v1/{project_id}/visualization-jobs

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
查询镜像详情 - AI开发平台ModelArts

ASCEND service_type String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

当数据集使用完成或不再使用时，调用删除数据集接口删除数据集。前提条件已获取IAM的EndPoint和ModelArts的EndPoint。确认服务的部署区域，获取项目名称和ID、获取帐号名和ID和获取用户名和ID。已经准备好数据源，例如存放在OBS的“/test-obs/classify

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
附录：训练常见问题 - AI开发平台ModelArts

duleNotFoundError: No module named 'tyro'" 错误截图：报错原因：未指定tyro依赖包版本，导致安装依赖为最新0.9.0版本导致与其他依赖冲突解决措施：任务前容器内更新'tyro'版本为0.8.14或以下版本 pip install tyro==0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

调用批量更新样本标签根据获取的智能标注样本列表确认智能标注结果。前提条件已获取IAM的EndPoint和ModelArts的EndPoint。确认服务的部署区域，获取项目名称和ID、获取帐号名和ID和获取用户名和ID。已准备好用于智能标注的图像分类的数据集，并获取数据集ID，例如“6mHUG

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
计费概述 - AI开发平台ModelArts
计费概述 - AI开发平台ModelArts

服务 ModelArts Studio（MAAS）运行日志（不开启则不计费）由云日志服务（LTS）提供日志收集、分析、存储等服务。部署服务时，开启“运行日志输出”后，日志数据超出LTS免费额度后，会产生费用。具体可参考云日志服务价格详情按实际日志量付费超过免费额度后，按实际日志存储量和存储时长收费

 帮助中心 > AI开发平台ModelArts > 计费说明
Ascend-vLLM推理常见问题 - AI开发平台ModelArts

completed 图3 服务端响应200 图4 仍返回报错Response payload is not completed 解决方法：安装brotlipy后返回正确报错 pip install brotlipy 问题10：使用benchmark-tools访问推理客户端返回报错或警告

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
昇腾能力应用地图 - AI开发平台ModelArts

指导文档 DeepSeek R1 推理 MindIE DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 DeepSeek V3 推理 MindIE LLM大语言模型 ModelArts针对以下主流的LLM大模型进行了基于昇腾NPU的适配

 帮助中心 > AI开发平台ModelArts > 最佳实践
查询模型runtime - AI开发平台ModelArts

2-py_3.7-ubuntu_18.04-x86_64 request_mode Array of strings 请求模式，AI引擎支持部署为同步在线服务或异步在线服务。 sync：同步在线服务 async：异步在线服务 accelerators Array of Accelerator

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
推理服务精度评测 - AI开发平台ModelArts

_parallel方式，也不支持qwen-7b、qwen-14b、qwen-72b、chatglm2-6b、chatglm3-6b模型。安装精度评测工具。可以在原先的conda环境，进入到一个固定目录下，执行如下命令。 rm -rf lm-evaluation-harness/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

|── alpaca_gpt4_data.json # 微调数据文件在ECS服务器中安装obsutil工具，具体命令可参考obsutil工具快速使用，将OBS桶中的数据下载至SFS Turbo中。注意：需要使用用户账号中的AK

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 1870

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

使用GPTQ量化 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

查询可视化作业列表 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

计费概述 - AI开发平台ModelArts

Ascend-vLLM推理常见问题 - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线