搜索_华为云

执行训练任务（推荐） - AI开发平台ModelArts

出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

”并选择密钥对，请参考VS Code连接Notebook方式介绍。参数填写完成后，单击“立即创建”进行规格确认。参数确认无误后，单击“提交”，完成Notebook的创建操作。进入Notebook列表，正在创建中的Notebook状态为“创建中”，创建过程需要几分钟，请耐心等

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
在推理生产环境中部署推理服务 - AI开发平台ModelArts

时间建议设置为40分钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

时间建议设置为40分钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能测试：评估在固定输入、固定输出和固定并发下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

工作空间的约束与权限授权的约束是叠加生效的，意味着对于一个用户，必须同时拥有工作空间的访问权和训练任务的创建权限（且该权限覆盖至当前的工作空间），他才可以在这个空间里提交训练任务。对于已经开通企业项目但没有开通工作空间的用户，其所有操作均相当于在“default”企业项目里进行，请确保对应权限已覆盖了名为default的企业项目。

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts权限管理基本概念 - AI开发平台ModelArts

工作空间的约束与权限授权的约束是叠加生效的，意味着对于一个用户，必须同时拥有工作空间的访问权和训练任务的创建权限（且该权限覆盖至当前的工作空间），他才可以在这个空间里提交训练任务。对于已经开通企业项目但没有开通工作空间的用户，其所有操作均相当于在“default”企业项目里进行，请确保对应权限已覆盖了名为default的企业项目。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
自定义脚本代码示例 - AI开发平台ModelArts

import tensorflow as tf from six.moves import urllib # 训练数据来源于yann lecun官方网站http://yann.lecun.com/exdb/mnist/ SOURCE_URL = 'http://yann.lecun.com/exdb/mnist/'

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
创建生产训练作业 - AI开发平台ModelArts

训练作业的“标签”。标签详细用法请参见使用TMS标签实现资源分组管理。后续操作当创建训练作业的参数配置完成后，单击“提交”，在信息确认页面单击“确定”，提交创建训练作业任务。训练作业一般需要运行一段时间，前往训练作业列表，可以查看训练作业的基本情况。在训练作业列表中，刚创建的训练作业状态为“等待中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
数据管理权限 - AI开发平台ModelArts

kforceTask - √ √ 表7 团队标注流程管理的细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目提交验收任务的样本评审意见 POST /v2/{project_id}/datasets/{dataset_id}/workforce-tas

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
在推理生产环境中部署推理服务 - AI开发平台ModelArts

时间建议设置为40分钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
部署在线服务 - AI开发平台ModelArts

工程师添加权限。 instance_count 是 Integer 模型部署的实例数，当前限制最大实例数为128，如需使用更多的实例数，需提交工单申请。 envs 否 Map<String, String> 运行模型需要的环境变量键值对，可选填，默认为空。表4 transformer

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

时间建议设置为40分钟。此处仅介绍关键参数，更多详细参数解释请参见部署在线服务。图6 部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

案例教程本地IDE（PyCharm） ModelArts提供了一个PyCharm插件工具PyCharm ToolKit，协助用户完成代码上传、提交训练作业、将训练日志获取到本地展示等，用户只需要专注于本地的代码开发即可。使用PyCharm ToolKit连接Notebook 本地IDE（VS

帮助中心 > AI开发平台ModelArts > 功能总览
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

scend-Powered-Engine引擎的镜像中安装了与Ascend驱动适配的CANN（华为针对AI场景推出的异构计算架构）计算库。提交训练作业后，ModelArts Standard平台会自动运行训练作业的启动文件。 Ascend-Powered-Engine框架的启动文件的默认启动方式如下：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

登录ModelArts管理控制台，在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法” 启动方式：选择“自定义” 镜像地址：“swr.cn-north-4.myhuaweicloud.com

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
创建Notebook实例 - AI开发平台ModelArts

对所有支持标签功能的服务资源可见。租户自定义标签只对自己服务可见。参数填写完成后，单击“立即创建”进行规格确认。参数确认无误后，单击“提交”，完成Notebook的创建操作。进入Notebook列表，正在创建中的Notebook状态为“创建中”，创建过程需要几分钟，请耐心等

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
使用MaaS调优模型 - AI开发平台ModelArts

连续无条件重启3次。如果训练过程中触发了自动重启，则平台会自动获取最新的Checkpoint，并从该点重启任务。参数配置完成后，单击“提交”，在“计费提醒”对话框，确认调优作业的信息和预计消耗费用无误后，单击“确定”创建调优作业。在作业列表，当“状态”变成“已完成”时，表示模型调优完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

有免费GPU规格，可以选择免费规格进行训练。其他参数保持默认即可。本样例代码为单机单卡场景，选择GPU多卡规格会导致训练失败。单击“提交”，确认训练作业的参数信息，确认无误后单击“确定”。页面自动返回“训练作业”列表页，当训练作业状态变为“已完成”时，即完成了模型训练过程。

帮助中心 > AI开发平台ModelArts > 快速入门

总条数： 201

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行训练任务（推荐） - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

ModelArts权限管理基本概念 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

数据管理权限 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线