搜索_华为云

Lite Cluster资源配置 - AI开发平台ModelArts

Lite Cluster资源配置 Lite Cluster资源配置流程配置Lite Cluster网络配置kubectl工具配置Lite Cluster存储（可选）配置驱动（可选）配置镜像预热

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
训练代码迁移 - AI开发平台ModelArts

适配，包含增加了NPU设备、hccl等一系列能力的支持。安装后可以直接使用PyTorch的表达层来运行在NPU设备上。当前提供了自动迁移工具进行GPU到昇腾适配，原理是通过monkey-patch的方式将torch下的CUDA、nccl等操作映射为NPU和hccl对应的操作。如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
Standard数据管理 - AI开发平台ModelArts

ModelArts Standard数据管理支持多维度数据管理能力数据集管理：提供数据集创建、数据预览、数据集版本管理等能力数据标注：提供在线标注能力，包含图像分类、目标检测、音频分割、文本三元组等标注场景；提供图片智能标注方案，提升标注效率；提供团队标注能力，支持多人协同标注与标注任务的审核验收

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
mox.file与本地接口的对应关系和切换 - AI开发平台ModelArts

mox.file与本地接口的对应关系和切换 API对应关系 Python：指本地使用Python对本地文件的操作接口。支持一键切换为对应的MoXing文件操作接口（mox.file）。 mox.file：指MoXing框架中用于文件操作的接口，其与python接口一一对应关系。 tf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

GPU业务迁移至昇腾训练推理 ModelArts昇腾迁移调优工具总览基于LLM模型的GPU训练业务迁移至昇腾指导 GPU训练业务迁移至昇腾的通用指导基于AIGC模型的GPU推理业务迁移至昇腾指导 GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

件夹中。下载完成后，将数据上传至SFS相应目录中。由于数据集过大，推荐先通过obsutil工具将数据集传到OBS桶后，再将数据集迁移至SFS。在本机机器上运行，通过obsutil工具将本地数据集传到OBS桶。 # 将本地数据传至OBS中 # ./obsutil cp ${数据集所在的本地文件夹路径}

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
GPU推理业务迁移至昇腾的通用指导 - AI开发平台ModelArts

GPU推理业务迁移至昇腾的通用指导简介昇腾迁移快速入门案例迁移评估环境准备模型适配精度校验性能调优迁移过程使用工具概览常见问题推理业务迁移评估表父主题： GPU业务迁移至昇腾训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
ModelArts用户指南（AI Gallery） - AI开发平台ModelArts

在节点页签，单击选择“前往控制台”跳转到云服务器控制台，支持查看节点的云服务基本信息或进行远程登录等操作。在节点页签，单击选择“配置工具”会弹出配置工具页面，配置工具的下载使用请参见Gallery CLI配置工具介绍。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

Atlas 800训练服务器HCCN Tool Atlas 800 训练服务器 1.0.11 HCCN Tool接口参考主要介绍集群网络工具hccn_tool对外接口说明，包括配置RoCE网卡的IP、网关，配置网络检测对象IP和查询LLDP信息等。 Atlas 800训练服务器备件查询助手

 帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
查看训练作业详情 - AI开发平台ModelArts

“代码目录” 训练作业代码目录所在的OBS路径。您可以单击代码目录后的“编辑代码”，在“OBS在线编辑”对话框中实时编辑训练脚本代码。当训练作业状态为“等待中”、“创建中”和“运行中”时，不支持“OBS在线编辑”功能。说明：当您使用订阅算法创建训练作业时，不支持该参数。 “启动文件” 训练作业启动文件位置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
Notebook实例常见错误 - AI开发平台ModelArts

error”错误，可以运行代码，但是无法保存单击Notebook的打开按钮时报“请求超时”错误？使用CodeLab时报错kernel restart 使用SSH工具连接Notebook，服务器的进程被清理了，GPU使用率显示还是100% Notebook实例出现“Server Connection Error”错误

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
Standard支持的AI框架 - AI开发平台ModelArts

开发环境的Notebook，根据不同的工作环境，对应支持的镜像和版本有所不同。表3 新版Notebook支持的镜像镜像名称镜像描述适配芯片支持SSH远程开发访问支持在线JupyterLab访问 pytorch1.8-cuda10.2-cudnn7-ubuntu18.04 CPU、GPU通用算法开发和训练基础镜像，预置AI引擎PyTorch1

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root权限。在线上，模型文件从OBS下载到/home/mind/model目录之后，文件owner将统一修改为ma-user。在本地机器上启动另一个终端

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建预测分析项目 - AI开发平台ModelArts

标签列是预测模型的输出。模型训练步骤将使用全部信息训练预测模型，该模型以其他列的数据为输入，以标签列的预测值为输出。模型部署步骤将使用预测模型发布在线预测服务。 “输出路径” 选择自动学习数据输出的统一OBS路径。说明： “输出路径”是存储自动学习在运行过程中所有产物的路径。 “训练规格”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
附录：指令微调训练常见问题 - AI开发平台ModelArts

解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训练加速框架的选择，如原使用Accelerator可替换为Deepspeed-ZeRO-1，De

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
如何使用API接口获取订阅算法的订阅id和版本id？ - AI开发平台ModelArts

如何使用API接口获取订阅算法的订阅id和版本id？调用API接口使用“我的订阅”方式创建训练作业时，请求参数需要填写算法的订阅id（algorithm.subscription_id）和版本id（algorithm.item_version_id）。可调用如下接口获取相关信息，如下以北京四为例：

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
管理AI Gallery镜像 - AI开发平台ModelArts

用场景、使用方法等信息。编辑完成后，单击“确认”保存修改。管理镜像文件预览文件在镜像详情页，选择“镜像文件”页签。单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。下载文件在镜像详情页，选择“镜像文件”页签。单击操作列的“下

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

连接。更多Screen使用说明可参考Screen User's Manual。通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题本文指导用户通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题。在ModelArts Standard控制台，选择“模型训练>训练作业”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
一般性问题 - AI开发平台ModelArts

AI识别可以单独针对一个标签识别吗？ ModelArts如何通过标签实现资源分组管理为什么资源充足还是在排队？规格中数字分别代表什么含义？如何删除预置镜像中不需要的工具

 帮助中心 > AI开发平台ModelArts > 常见问题

总条数： 921

上一页
1
...
19
20
21
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Cluster资源配置 - AI开发平台ModelArts

训练代码迁移 - AI开发平台ModelArts

Standard数据管理 - AI开发平台ModelArts

mox.file与本地接口的对应关系和切换 - AI开发平台ModelArts

GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

GPU推理业务迁移至昇腾的通用指导 - AI开发平台ModelArts

ModelArts用户指南（AI Gallery） - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

查看训练作业详情 - AI开发平台ModelArts

Notebook实例常见错误 - AI开发平台ModelArts

Standard支持的AI框架 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

创建预测分析项目 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

如何使用API接口获取订阅算法的订阅id和版本id？ - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

一般性问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线