搜索_华为云

如何删除预置镜像中不需要的工具 - AI开发平台ModelArts

如何删除预置镜像中不需要的工具预置的基础镜像中存在cpp、gcc等调试/编译工具，如果您不需要使用这些工具，可以通过运行脚本删除。创建一个run.sh脚本文件，文件中的代码内容如下。然后在容器中执行sh run.sh命令运行脚本。 #!/bin/bash delete_sniff_compiler()

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
修复Standard专属资源池故障节点 - AI开发平台ModelArts

是对故障节点的切换，此时仍需对切换后的故障节点进行维修，维修后才能用于后续的自动切换。故障节点修复后，“高可用冗余”标签维持不变，修复好的节点变为新的高可用冗余节点。相比于其他故障修复方式，高可用冗余节点可使用户免于关注节点状态，减少运维成本。但由于用户需要付费购买备用节点作为高可用冗余节点，因此资源成本会提高。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
性能可视化工具与性能分析工具 - AI开发平台ModelArts

性能可视化工具与性能分析工具对于高阶的调优用户，可以使用可视化profiling数据查看数据详情并分析可优化点，昇腾提供了Ascend-Insight可视化工具，相比于Chrometrace等工具提供了更优的功能和性能。详细信息，请参见昇腾Ascend-Insight用户指南。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
自动诊断工具MA-Advisor简介 - AI开发平台ModelArts

时给出相关修复建议。自动诊断工具可以有效减少人工分析profiling的耗时，降低性能调优的门槛，帮助客户快速识别性能瓶颈点并完成性能优化。推荐用户在采集profiling分析后使用自动诊断工具进行初步性能调优。更进一步的性能调优再使用Ascend-Insight工具进行数据可视化并人工分析瓶颈点。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > MA-Advisor自动诊断工具使用指导
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

太大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，建议您创建一个新的Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

太大或者训练层数太多，亦或者其他原因，导致出现“内存不够”问题，最终导致该容器实例崩溃。出现此问题后，系统将自动重启Notebook，来修复实例崩溃的问题。此时只是解决了崩溃问题，如果重新运行训练代码仍将失败。如果您需要解决“内存不够”的问题，建议您创建一个新的Noteboo

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
迁移过程使用工具概览 - AI开发平台ModelArts

iling采集工具集成到同一个工具中，极大简化了用户的使用流程。建议在迁移过程中使用Tailor工具替代下面列举的原始工具MS Convertor、Benchmark和msprof。使用指导详见AIGC工具tailor使用指导。模型转换工具离线转换模型功能的工具MSLite

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
安装Gallery CLI配置工具 - AI开发平台ModelArts

在节点页签，单击选择“配置工具”，弹出该节点的配置工具页面。在配置工具页面，单击“下载”启动下载任务。当配置工具的状态记录中“工具状态”为“下载完成”时表示下载完成，工具包存放在“下载位置”的目录下。如果下载失败，单击“下载”可以重新下载。登录云服务器查看工具包是否下载成功。在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
训练benchmark工具 - AI开发平台ModelArts

训练benchmark工具工具介绍及准备工作训练性能测试训练精度测试父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
训练benchmark工具 - AI开发平台ModelArts

训练benchmark工具工具介绍及准备工作训练性能测试训练精度测试父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911）
服务部署、启动、升级和修改时，镜像不断重启如何处理？ - AI开发平台ModelArts

服务部署、启动、升级和修改时，镜像不断重启如何处理？问题现象服务部署、启动、升级和修改时，镜像不断重启。原因分析容器镜像代码错误解决方法根据容器日志进行排查，修复代码，重新创建模型，部署服务。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
使用Msprobe工具分析偏差 - AI开发平台ModelArts

使用Msprobe工具分析偏差观察上一章Loss趋势，在首个Step有较小偏差，所以对第一个Step进行比对分析。此处使用Msprobe的整网Dump和比对分析功能。首先安装社区Msprobe工具，命令如下： pip install mindstudio-probe 使能工具进行数据Dump分析。本实验可在train

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优 > 精度对齐
AIGC工具tailor使用指导 - AI开发平台ModelArts

AIGC工具tailor使用指导 tailor简介 tailor是AIGC场景下用于模型转换（onnx到mindir）和性能分析的辅助工具，当前支持以下功能。表1 功能总览功能大类具体功能模型转换固定shape转模型动态shape传入指定档位转模型支持fp32 支持AOE优化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

节）。如果您使用的是ModelArts基础镜像，可先尝试直接使用工具命令，如果相关命令不存在则需要参考工具安装指导自行安装。表1 ModelArts昇腾迁移调优工具总览表使用场景类别工具名称工具描述工具安装使用指导 PyTorch GPU训练迁移至PyTorch NPU训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件在服务器（ModelArts Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。命令说明登录Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
配置kubectl工具 - AI开发平台ModelArts

链接信息使用kubectl工具。若通过内网使用kubectl工具，需要将kubectl工具安装在和集群在相同vpc下的某一台机器上。单击kubectl后的“配置”按钮。按照界面提示步骤操作即可。图3 通过内网使用kubectl工具通过公网使用kubectl工具，可以将kubectl安装在任一台可以访问公网的机器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
通过SSH工具远程使用Notebook - AI开发平台ModelArts

密钥对在用户第一次创建时，自动下载，之后使用相同的密钥时不会再有下载界面（用户一定要保存好），或者每次都使用新的密钥对。 Step1 安装SSH工具下载并安装SSH远程连接工具，以PuTTY为例，下载链接。 Step2 使用puttygen将密钥对.pem文件转成.ppk文件下载puttygen，并双击运行puttygen。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化当前版本使用llm-compressor工具量化仅支持Deepseek-v2系列模型的W8A8量化。本章节介绍如何在GPU的机器上使用开源量化工具llm-compressor量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化当前版本使用llm-compressor工具量化仅支持Deepseek-v2系列模型的W8A8量化。本章节介绍如何在GPU的机器上使用开源量化工具llm-compressor量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化当前版本使用llm-compressor工具量化仅支持Deepseek-v2系列模型的W8A8量化。本章节介绍如何在GPU的机器上使用开源量化工具llm-compressor量化模型权重，然后在NPU的机器上实现推理量化。具体操作如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化

总条数： 1248

上一页
1
2
3
4
5
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何删除预置镜像中不需要的工具 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

性能可视化工具与性能分析工具 - AI开发平台ModelArts

自动诊断工具MA-Advisor简介 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

训练benchmark工具 - AI开发平台ModelArts

训练benchmark工具 - AI开发平台ModelArts

服务部署、启动、升级和修改时，镜像不断重启如何处理？ - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

配置kubectl工具 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线