搜索_华为云

AIGC工具tailor使用指导 - AI开发平台ModelArts

AIGC工具tailor使用指导 tailor简介 tailor是AIGC场景下用于模型转换（onnx到mindir）和性能分析的辅助工具，当前支持以下功能。表1 功能总览功能大类具体功能模型转换固定shape转模型动态shape传入指定档位转模型支持fp32 支持AOE优化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

节）。如果您使用的是ModelArts基础镜像，可先尝试直接使用工具命令，如果相关命令不存在则需要参考工具安装指导自行安装。表1 ModelArts昇腾迁移调优工具总览表使用场景类别工具名称工具描述工具安装使用指导 PyTorch GPU训练迁移至PyTorch NPU训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
Notebook提示磁盘空间已满 - AI开发平台ModelArts

exceeded。原因分析在JupyterLab浏览器左侧导航删除文件后，会默认放入回收站占用内存，导致磁盘空间不足。磁盘配额不足。处理方法查看虚拟机所使用的存储空间，再查看回收站文件占用内存，根据实际删除回收站里不需要的大文件。在Notebook实例详情页，查看实例的存储容量。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
配置kubectl工具 - AI开发平台ModelArts

使用kubectl工具。如果通过内网使用kubectl工具，需要将kubectl工具安装在和集群在相同vpc下的某一台机器上。单击kubectl后的“配置”按钮。按照界面提示步骤操作即可。图3 通过内网使用kubectl工具通过公网使用kubectl工具，可以将kubectl安装在任一台可以访问公网的机器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
附录：部署常见问题 - AI开发平台ModelArts

memory size is not enough“的问题问题：容器共享内存不足解决方法：在启动docker的命令中增加“--shm-size=${memSize}“，其中memSize为要设置的共享内存大小，如2g。 --shm-size 2g \ 如何解决MindIE服务已退出情况下显存依然占用的问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理应用 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
迁移过程使用工具概览 - AI开发平台ModelArts

iling采集工具集成到同一个工具中，极大简化了用户的使用流程。建议在迁移过程中使用Tailor工具替代下面列举的原始工具MS Convertor、Benchmark和msprof。使用指导详见AIGC工具tailor使用指导。模型转换工具离线转换模型功能的工具MSLite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

NPU推理指导（6.3.905）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，建议您创建一个新的Notebook

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

NPU推理指导（6.3.906）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904）推理场景介绍部署推理服务推理性能测试推理精度测试父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

802原因为缺少fabricmanager，可能由于以下原因导致nvidia-fabricmanager.service不工作：可能系统资源不足、如内存不足、内存泄露。硬件故障、如IB网络或者GPU互联设备故障等。没安装nvidia-fabricmanager组件或被误卸载。处理方法如果

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化 Eagle投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）推理场景介绍部署推理服务推理性能测试推理精度测试附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）推理场景介绍准备工作部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题附录：工作负载Pod异常问题和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

方法2：可以参考如下方法调整代码中的参数，减少内存占用。如果代码调整后仍然出现内存不足的情况，请使用方法1。调用sklearn方法silhouette_score(addr_1,siteskmeans.labels)，可以指定参数sample_size来减少内存占用。调用train方法的时候

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

NPU推理指导（6.3.910）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化 eagle 投机小模型训练附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：Standard大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

NPU推理指导（6.3.907）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理standard常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理

总条数： 1075

上一页
1
2
3
4
5
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

AIGC工具tailor使用指导 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

Notebook提示磁盘空间已满 - AI开发平台ModelArts

配置kubectl工具 - AI开发平台ModelArts

附录：部署常见问题 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

出现ModelArts.6333错误，如何处理？ - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线