搜索_华为云

查看训练作业事件 - AI开发平台ModelArts

[worker-0] [耗时：秒] 训练输入（参数名称：）下载失败，失败原因： [worker-0] 正在安装Python依赖包，导入文件： [worker-0] [耗时：秒] Python依赖包安装完成，导入文件： [worker-0] 训练作业开始运行 [worker-0] 训练作业运行结束，退出码

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建资源池 - AI开发平台ModelArts

Integer 资源规格的弹性资源量。物理池中该值和count必须一致。 extendParams 否 extendParams object 自定义配置参数。表9 extendParams 参数是否必选参数类型描述 dockerBaseSize 否 String 指定资源池节点的容器引擎空间大小。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

预置工作流生成指定场景模型，无需深究底层模型开发细节。ModelArts PRO底层依托ModelArts平台提供数据标注、模型训练、模型部署等能力。也可以理解为增强版的自动学习，提供行业AI定制化开发套件，沉淀行业知识，让开发者聚焦自身业务。父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明本文档主要介绍昇腾云服务6.3.907版本配套的镜像地址、软件包获取方式和支持的特性能力。当前版本仅适用于华为公有云。配套的基础镜像镜像地址获取方式镜像软件说明配套关系西南-贵阳一 PyTorch： swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
训练脚本存放目录说明 - AI开发平台ModelArts

# 构建镜像 └── qwen-vl_install.sh # 安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练脚本参数说明 - AI开发平台ModelArts

# 构建镜像 └── qwen-vl_install.sh # 安装模型运行环境 └── qwen-vl.patch # 使用git apply修改模型相关代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
查询模型对象列表 - AI开发平台ModelArts

order="desc") print(model_object_list) 参数说明查询模型列表，返回list，list大小等于当前用户所有已经部署的模型个数， list中每个元素都是Model对象，对象属性和查询模型详情相同。查询模型列表返回说明： model_list = [model_instance1

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
在ModelArts控制台查看监控指标 - AI开发平台ModelArts

训练作业：用户在运行训练作业时，可以查看多个计算节点的CPU、GPU、NPU资源使用情况。具体请参见训练资源监控章节。在线服务：用户将模型部署为在线服务后，可以通过监控功能查看CPU、内存、GPU等资源使用统计信息和模型调用次数统计，具体参见查看服务详情章节。父主题： ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
用户AK-SK认证模式 - AI开发平台ModelArts

用户AK-SK认证模式本模式支持OBS管理、训练管理、模型管理、服务管理模块的鉴权。示例代码 1 2 from modelarts.session import Session session = Session(access_key='***',secret_key='***'

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
查询服务对象列表 - AI开发平台ModelArts

e") print(predictor_object_list) 参数说明查询服务列表，返回list，list大小等于当前用户所有已经部署的服务个数，list中每个元素都是Predictor对象，对象属性同本章初始化服务。查询服务列表返回说明：service_list_resp

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

化。量化的一般步骤是：1、对浮点类型的权重镜像量化并保存量化完的权重；2、使用量化完的权重进行推理部署。什么是W4A16量化 W4A16量化方案能显著降低模型显存以及需要部署的卡数（约75%）。大幅降低小batch下的增量推理时延。约束限制支持AWQ W4A16、 per

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
数据保护技术 - AI开发平台ModelArts

在ModelArts中导入模型时，支持用户自己选择HTTP和HTTPS两种传输协议，为保证数据传输的安全性，推荐用户使用更加安全的HTTPS协议。数据完整性检查推理部署功能模块涉及到的用户模型文件和发布到AIGallery的资产在上传过程中，有可能会因为网络劫持、数据缓存等原因，存在数据不一致的问题。Mo

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
作业状态参考 - AI开发平台ModelArts

JOBSTAT_SUBMIT_MODEL_FAILED，提交模型失败。 17 JOBSTAT_DEPLOY_SERVICE_FAILED，部署服务失败。 18 JOBSTAT_CHECK_INIT,审核作业初始化。 19 JOBSTAT_CHECK_RUNNING，审核作业正在运行中。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
训练迁移适配 - AI开发平台ModelArts

执行以下命令，下载代码。 git clone https://github.com/facebookresearch/DiT.git cd Dit 执行以下命令，安装依赖项。 pip install diffusers==0.28.0 accelerate==0.30.1 timm==0.9.16 准备数据集。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
Eagle投机小模型训练 - AI开发平台ModelArts

ma2系列和Qwen2系列模型。步骤一：安装Eagle Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

ma2系列和Qwen2系列模型。步骤一：安装Eagle Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
Eagle投机小模型训练 - AI开发平台ModelArts

ma2系列和Qwen2系列模型。步骤一：安装Eagle Eagle训练适配代码存放在代码包AscendCloud-LLM-x.x.x.zip的llm_tools/spec_decode/EAGLE目录下。在目录下执行如下命令，即可安装Eagle。 bash build.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

由于发布后的数据集不会默认启动数据特征分析，针对数据集的各个版本，需手动启动特征分析任务。在数据特征页签下，单击“启动特征分析”。在弹出的对话框中配置需要进行特征分析的数据集版本，然后单击“确定”启动分析。 “版本选择”，即选择当前数据集的已发布版本。图1 启动数据特征分析任务数据特

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
文生图模型训练推理 - AI开发平台ModelArts

1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践
启动/停止/删除实例 - AI开发平台ModelArts

“/home/ma-user/work”目录以及动态挂载在“/data”下的目录下的数据会保存，其余目录下内容会被清理。例如：用户在开发环境中的其他目录下安装的外部依赖包等，在Notebook停止后会被清理。您可以通过保存镜像的方式保留开发环境设置，具体操作请参考保存Notebook实例。 No

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例

总条数： 1628

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看训练作业事件 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

ModelArts自动学习与ModelArts PRO的区别是什么？ - AI开发平台ModelArts

昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

训练脚本存放目录说明 - AI开发平台ModelArts

训练脚本参数说明 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

在ModelArts控制台查看监控指标 - AI开发平台ModelArts

用户AK-SK认证模式 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

数据保护技术 - AI开发平台ModelArts

作业状态参考 - AI开发平台ModelArts

训练迁移适配 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

文生图模型训练推理 - AI开发平台ModelArts

启动/停止/删除实例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线