搜索_华为云

训练作业失败，返回错误码139 - AI开发平台ModelArts

训练作业失败，返回错误码139 问题现象训练作业运行失败，返回错误码139，如下图所示： [Modelarts Service Log]Training end with reeturn code: 139 INFO:root:Using MoXing-v1.17.2-c806a92f

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

Model import task submitted. 模型导入任务提交成功模型导入任务提交成功 200 ModelArts.4912 Model import task executed. 模型导入任务执行成功模型导入任务执行成功 200 ModelArts.4914 Auto

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

ints文件夹的数据到新建的文件夹下。执行mkdir xxx命令，新建一个文件夹，例如“xxx”（不要用checkpoints关键字命名）然后移动checkpoints文件夹的数据到新建的文件夹下，删除根目录下checkpoints文件夹即可。 mv checkpoints/*

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
订阅算法物体检测YOLOv3 - AI开发平台ModelArts

订阅算法物体检测YOLOv3_ResNet18(Ascend)训练失败报错label_map.pbtxt cannot be found 问题现象使用订阅算法物体检测YOLOv3_ResNet18(Ascend) 进行训练作业，训练失败报错label_map.pbtxt cannot be

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

Standard上运行GPU训练作业的场景介绍不同AI模型训练所需要的数据量和算力不同，在训练时选择合适的存储及训练方案可提升模型训练效率与资源性价比。ModelArts Standard支持单机单卡、单机多卡和多机多卡的训练场景，满足不同AI模型训练的要求。 ModelArts Stand

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
应用迁移 - AI开发平台ModelArts
应用迁移 - AI开发平台ModelArts

应用迁移模型适配 pipeline代码适配父主题：基于AIGC模型的GPU推理业务迁移至昇腾指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建资源池失败 - AI开发平台ModelArts

Cluster”页面。您可以通过单击“购买AI专属集群”右侧的“操作记录”，查看当前处于失败状态的资源池信息。图1 创建失败资源池信息鼠标悬停在“状态”列的上，即可看到该操作失败的具体原因。失败的记录默认按照操作的申请时间排序，最多显示500条并保留3天。父主题：资源池

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错问题现象 ModelArts SDK在OBS下载文件时，目标路径设置为文件名，在本地IDE运行不报错，部署为在线服务时报错。代码如下： session.obs.download_file（obs_path,

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

增加了和OBS交互工作的整个训练流程如下：建议使用OBSutil作为和OBS交互的工具，如何在本机安装obsutil可以参考安装和配置OBS命令行工具。训练数据、代码、模型下载。（本地使用硬盘挂载或者docker cp，在ModelArts上使用OBSutil）启动脚本，用法无切换，一般就是到达执行目录，然后python

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
MaaS使用场景和使用流程 - AI开发平台ModelArts

Studio大模型即服务平台开始模型调优。模型调优，即使用训练数据集和验证数据集训练模型。使用MaaS调优模型模型压缩在ModelArts Studio大模型即服务平台支持对自定义模型进行模型压缩，以此提升推理服务性能、降低部署成本。使用MaaS压缩模型 4 模型部署 ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在ModelArts的Notebook中JupyterLab的目录、Terminal的文件和OBS的文件之间的关系是什么？ - AI开发平台ModelArts

nal的文件和OBS的文件之间的关系是什么？ JupyterLab目录的文件与Terminal中work目录下的文件相同。即用户在Notebook中新建的，或者是从OBS目录中同步的文件。挂载OBS存储的Notebook，JupyterLab目录的文件可以与OBS的文件进行同步

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
修改批量服务配置 - AI开发平台ModelArts

表1 支持无损滚动升级的场景创建模型的元模型来源服务使用的是公共资源池服务使用的是专属资源池从训练中选择元模型不支持不支持从容器镜像中选择元模型不支持支持，创建模型的自定义镜像需要满足创建模型的自定义镜像规范。从OBS中选择元模型不支持不支持方式一：通过服务管理页面修改服务信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
修改在线服务配置 - AI开发平台ModelArts

表1 支持无损滚动升级的场景创建模型的元模型来源服务使用的是公共资源池服务使用的是专属资源池从训练中选择元模型不支持不支持从容器镜像中选择元模型不支持支持，创建模型的自定义镜像需要满足创建模型的自定义镜像规范。从OBS中选择元模型不支持不支持方式一：通过服务管理页面修改服务信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

使用MoXing训练模型，“global_step”放在Adam名称范围下，而非MoXing代码中没有Adam名称范围，如图1所示。其中1为使用MoXing代码，2代表非MoXing代码。图1 代码示例处理方法 Fine Tune就是用别人训练好的模型，加上自己的数据，来训练新的模型。相当

 帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

LoRA训练本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_lora_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
从OBS下载文件 - AI开发平台ModelArts

是 String 下载目标的本地文件夹，下载的本地目标文件夹后缀必须以“/”结尾。表2 失败响应参数说明参数参数类型描述 error_code String 调用失败时的错误码。调用成功时无此字段。 error_msg String 调用失败时的错误信息。调用成功时无此字段。

帮助中心 > AI开发平台ModelArts > SDK参考 > OBS管理
解析Pascal VOC文件 - AI开发平台ModelArts

解析Pascal VOC文件解析xml文件支持本地和OBS，如果是OBS，需要Session信息。 PascalVoc.parse_xml(xml_file_path, session=None) 示例代码指定xml路径，通过调用parse_xml来解析获取xml文件的信息。 from

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX 请求在APIG（API网关）出现问题被拦截，报错APIG.XXXX。常见报错： APIG.0101 预测地址错误 APIG.0201 请求体内容过大 APIG.0301 鉴权失败 APIG.1009 AppKey和AppSecret不匹配

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
日志提示Compile graph failed - AI开发平台ModelArts

graph failed 问题现象日志提示：Compile graph failed。图1 报错提示原因分析模型转换时未指定Ascend后端。处理方法需要在模型转换阶段指定“--device=Ascend”。父主题：常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 常见问题
资源选择推荐 - AI开发平台ModelArts

资源选择推荐不同AI模型训练所需要的数据量和算力不同，在训练时选择合适存储及训练方案可提升模型训练效率与资源性价比。ModelArts支持单机单卡、单机多卡和多机多卡的训练场景，满足不同AI模型训练的要求。针对第一次使用ModelArts的用户，本文提供端到端案例指导，帮助您快

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练

总条数： 2329

上一页
1
...
71
72
73
...
117
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业失败，返回错误码139 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

订阅算法物体检测YOLOv3 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

应用迁移 - AI开发平台ModelArts

创建资源池失败 - AI开发平台ModelArts

ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

在ModelArts的Notebook中JupyterLab的目录、Terminal的文件和OBS的文件之间的关系是什么？ - AI开发平台ModelArts

修改批量服务配置 - AI开发平台ModelArts

修改在线服务配置 - AI开发平台ModelArts

moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？ - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

从OBS下载文件 - AI开发平台ModelArts

解析Pascal VOC文件 - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX - AI开发平台ModelArts

日志提示Compile graph failed - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线