搜索_华为云

精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

精度对齐长训Loss比对结果使用Msprobe工具分析偏差 Loss对齐结果父主题： Dit模型PyTorch迁移与精度性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） - AI开发平台ModelArts

Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）场景介绍准备工作执行训练任务查看日志和性能训练benchmark工具训练脚本说明附录：训练常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）场景介绍准备工作执行训练任务查看日志和性能训练benchmark工具训练脚本说明附录：训练常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

性能调优 Profiling数据采集使用Advisor工具分析生成调优建议调优前后性能对比父主题： Dit模型PyTorch迁移与精度性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
服务预测失败 - AI开发平台ModelArts

请根据构建日志报错信息，定位服务预测失败原因，修改模型推理代码后，重新导入模型进行预测。经典案例：在线服务预测报错MR.0105 出现其他情况，优先检查客户端和外部网络是否有问题。以上方法均未解决问题，请联系系统管理员。父主题：服务预测

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

om格式的模型转换能力，在ModelArts中逐步增加.mindir格式的支持能力。下线模型转换后是否有替代功能？您可以通过链接下载ATC模型转换工具，按照指导，在线下转换成.om格式模型。 ModelArts中是否还会增加模型转换的能力？ ModelArts开发环境中在贵阳一Regio

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

requirements are installed’ 原因分析出现该问题的可能原因如下：用户/训练系统，将CUDA_VISIBLE_DEVICES传错了，检查CUDA_VISIBLE_DEVICES变量是否正常。用户选择了1/2/4卡这些规格的作业，然后设置了CUDA_VISIBLE_DEVI

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
PyTorch迁移精度调优 - AI开发平台ModelArts

PyTorch迁移精度调优精度问题概述精度调优总体思路精度调优前准备工作 msprobe精度分析工具使用指导父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
训练网络迁移总结 - AI开发平台ModelArts

独特的优势，而NPU上的执行目前还是依赖于算子的下发，对于NPU构造的理解是昇腾训练迁移中必备的知识，只有对于昇腾有基础理解，配合一些诊断工具，面对复杂问题时，才能进行进一步诊断与定位，进而发挥NPU的能力。性能调优可以先将重点放在NPU不亲和的问题处理上，确保一些已知的性能问

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
使用Notebook进行AI开发调试 - AI开发平台ModelArts

通过JupyterLab在线使用Notebook实例进行AI开发通过PyCharm远程使用Notebook实例通过VS Code远程使用Notebook实例通过SSH工具远程使用Notebook 管理Notebook实例使用CodeLab免费体验Notebook ModelArts CLI命令参考在Notebook中使用Moxing命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
推理模型量化 - AI开发平台ModelArts

推理模型量化使用AWQ量化使用SmoothQuant量化使用kv-cache-int8量化使用GPTQ量化使用llm-compressor工具量化父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
moondream2基于Lite Server适配PyTorch NPU推理指导 - AI开发平台ModelArts

管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

性能调优单模型性能测试工具Mindspore lite benchmark 单模型性能调优AOE 父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
GPU推理业务迁移至昇腾的通用指导 - AI开发平台ModelArts

GPU推理业务迁移至昇腾的通用指导简介昇腾迁移快速入门案例迁移评估环境准备模型适配精度校验性能调优迁移过程使用工具概览常见问题推理业务迁移评估表父主题： GPU业务迁移至昇腾训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
Lite Cluster资源配置 - AI开发平台ModelArts

Lite Cluster资源配置 Lite Cluster资源配置流程配置Lite Cluster网络配置kubectl工具配置Lite Cluster存储（可选）配置驱动（可选）配置镜像预热

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
Yolov8基于Lite Server适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

核IO已经阻塞，无法执行相关GPU命令，只能尝试释放D+进程。处理方法 “nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理

总条数： 799

上一页
1
...
23
24
25
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

精度对齐 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

PyTorch迁移精度调优 - AI开发平台ModelArts

训练网络迁移总结 - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

使用Notebook进行AI开发调试 - AI开发平台ModelArts

推理模型量化 - AI开发平台ModelArts

moondream2基于Lite Server适配PyTorch NPU推理指导 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

GPU推理业务迁移至昇腾的通用指导 - AI开发平台ModelArts

Lite Cluster资源配置 - AI开发平台ModelArts

Yolov8基于Lite Server适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

LLaVA模型基于Lite Server适配PyTorch NPU预训练指导（6.3.912） - AI开发平台ModelArts

Wav2Lip推理基于Lite Server适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线