搜索_华为云

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

进行授权。在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： cd /home/ma-use

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

pnt004(需申请)/modelarts.vm.ai1.snt3(需申请)/custom(仅支持在部署到专属资源池时使用)，需申请的规格请提交工单，由ModelArts运维工程师添加权限。若配置为custom，需同时指定custom_spec参数。 weight 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

ain.sh支持多机训练。图5 选择资源池规格作业日志路径：选择输出日志到OBS的指定目录。图6 选择作业日志路径填写参数完成后，提交创建训练任务，训练完成后，作业状态会显示为已完成。图7 训练完成父主题：文生图模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
执行训练任务（历史版本） - AI开发平台ModelArts

出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

GP Ant8裸金属服务器Ubuntu 20.04安装NVIDIA 515+CUDA 11.7 安装NVIDIA驱动打开NVIDIA官方网站。以Ant8规格为例，根据Ant8的详细信息和您所需的cuda版本选择驱动。图1 驱动选择选择后会自动出现Driver版本并下载，或者直接。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
推理性能测试 - AI开发平台ModelArts

同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
执行训练任务（推荐） - AI开发平台ModelArts

出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

”并选择密钥对，请参考VS Code连接Notebook方式介绍。参数填写完成后，单击“立即创建”进行规格确认。参数确认无误后，单击“提交”，完成Notebook的创建操作。进入Notebook列表，正在创建中的Notebook状态为“创建中”，创建过程需要几分钟，请耐心等

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
ModelArts权限管理基本概念 - AI开发平台ModelArts

工作空间的约束与权限授权的约束是叠加生效的，意味着对于一个用户，必须同时拥有工作空间的访问权和训练任务的创建权限（且该权限覆盖至当前的工作空间），他才可以在这个空间里提交训练任务。对于已经开通企业项目但没有开通工作空间的用户，其所有操作均相当于在“default”企业项目里进行，请确保对应权限已覆盖了名为default的企业项目。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

时间建议设置为40分钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

工作空间的约束与权限授权的约束是叠加生效的，意味着对于一个用户，必须同时拥有工作空间的访问权和训练任务的创建权限（且该权限覆盖至当前的工作空间），他才可以在这个空间里提交训练任务。对于已经开通企业项目但没有开通工作空间的用户，其所有操作均相当于在“default”企业项目里进行，请确保对应权限已覆盖了名为default的企业项目。

帮助中心 > AI开发平台ModelArts > 产品介绍
在推理生产环境中部署推理服务 - AI开发平台ModelArts

时间建议设置为40分钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

案例教程本地IDE（PyCharm） ModelArts提供了一个PyCharm插件工具PyCharm ToolKit，协助用户完成代码上传、提交训练作业、将训练日志获取到本地展示等，用户只需要专注于本地的代码开发即可。使用PyCharm ToolKit连接Notebook 本地IDE（VS

帮助中心 > AI开发平台ModelArts > 功能总览
创建生产训练作业 - AI开发平台ModelArts

训练作业的“标签”。标签详细用法请参见使用TMS标签实现资源分组管理。后续操作当创建训练作业的参数配置完成后，单击“提交”，在信息确认页面单击“确定”，提交创建训练作业任务。训练作业一般需要运行一段时间，前往训练作业列表，可以查看训练作业的基本情况。在训练作业列表中，刚创建的训练作业状态为“等待中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
附录 - AI开发平台ModelArts
附录 - AI开发平台ModelArts

附录各模型支持的最小卡数和最大序列 Ascend-vLLM推理常见问题父主题：主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
数据管理权限 - AI开发平台ModelArts

kforceTask - √ √ 表7 团队标注流程管理的细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目提交验收任务的样本评审意见 POST /v2/{project_id}/datasets/{dataset_id}/workforce-tas

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
创建开发环境实例 - AI开发平台ModelArts

"'/，缺省值为空。 flavor 是 String 实例的机器规格。实际支持规格以具体区域为准。如果您需要使用默认规格之外的其他规格，请提交工单修改规格。 spec 是 Object 实例定义，当前仅支持Notebook，如表3所示。 workspace 否 Object 工作

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）

总条数： 255

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

附录 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线