搜索_华为云

训练作业进程被kill - AI开发平台ModelArts

在开发环境（notebook）申请相同规格的开发环境实例。在notebook调试用户代码，并找出问题的代码段。通过关键代码段 + 退出码尝试去搜索引擎寻找解决办法。，通过训练日志排查问题通过日志判断出问题的代码范围。修改代码，在问题代码段添加打印，输出更详细的日志信息。再次运行作业，判断出问题的代码段。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
应用示例 - AI开发平台ModelArts
应用示例 - AI开发平台ModelArts

应用示例创建图像分类数据集并进行标注任务创建并完成图像分类的智能标注任务开发环境的应用示例以PyTorch框架创建训练作业（新版训练）创建和修改工作空间管理ModelArts服务的委托授权

 帮助中心 > AI开发平台ModelArts > API参考
批量删除样本 - AI开发平台ModelArts

参数类型描述 error_code String 操作失败的错误码。 error_msg String 操作失败的错误信息。 results Array of BatchResponse objects 批量删除样本的响应列表。 success Boolean 操作是否执行成功。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

功能咨询 ModelArts支持将模型部署为哪些类型的服务？在线服务和批量服务有什么区别？在线服务和边缘服务有什么区别？为什么选择不了Ascend Snt3资源？线上训练得到的模型是否支持离线部署在本地？服务预测请求体大小限制是多少？在线服务部署是否支持包周期？部署服务如何选择计算节点规格？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
更新节点池 - AI开发平台ModelArts

NodePoolSpec object 更新节点池的请求体。表4 NodePoolSpec 参数是否必选参数类型描述 resources 是 PoolResource object 节点池中的资源信息列表，包括资源规格和相应规格的资源数量，自定义配置等。表5 PoolResource

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
AIGC模型训练推理 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） SDXL基于DevServer适配PyTorch NPU的LoRA训练指导（6.3.905） SD1

帮助中心 > AI开发平台ModelArts > 最佳实践
创建网络 - AI开发平台ModelArts
创建网络 - AI开发平台ModelArts

列单击“启动IPv6”，如图3 打通VPC前，需要保证ModelArts网络和您的VPC网络都已开启IPv6，IPv6才会生效。若是打通VPC后，才开启ModelArts网络的IPv6或VPC网络的IPv6，此时需要重新打通VPC及子网，IPv6才会生效。图2 创建网络图3 启动IPv6

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
开发Workflow命令参考 - AI开发平台ModelArts

开发Workflow命令参考开发Workflow的核心概念介绍配置Workflow参数配置Workflow的输入输出目录创建Workflow节点构建Workflow多分支运行场景编排Workflow 发布Workflow 在Workflow中更新已部署的服务 Workflow高阶能力父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
文件上传下载 - AI开发平台ModelArts

upload后，数据将上传到哪里？如何下载Notebook中的文件到本地？如何将开发环境Notebook A的数据复制到Notebook B中？在Notebook中上传文件失败，如何解决？动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
Notebook实例常见错误 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？使用pip install时出现“没有空间”的错误使用pip install提示Read timed out 出现“save error”错误，可以运行代码，但是无法保存单击Notebook的打开按钮时报“请求超时”错误？使用CodeLab时报错kernel

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

750 /home/ma-user 排查密钥是否是和实例绑定的一致。停止实例，进入实例详情页。更新密钥：单击“认证”旁边的编辑按钮，然后单击“立即创建”创建并选择新密钥。重新使用VS Code连接实例，选择新创建的密钥。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
准备模型训练代码 - AI开发平台ModelArts

准备模型训练代码预置框架启动文件的启动流程说明开发用于预置框架训练的代码开发用于自定义镜像训练的代码自定义镜像训练作业配置节点间SSH免密互信父主题：使用ModelArts Standard训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在Notebook中使用Moxing命令 - AI开发平台ModelArts

MoXing Framework功能介绍 Notebook中快速使用MoXing mox.file与本地接口的对应关系和切换 MoXing常用操作的样例代码 MoXing进阶用法的样例代码父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

准备数据自动学习的每个项目对数据有哪些要求？创建预测分析自动学习项目时，对训练数据有什么要求？使用从OBS选择的数据创建表格数据集如何处理Schema信息？物体检测或图像分类项目支持对哪些格式的图片进行标注和训练？父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
查询训练作业镜像保存任务 - AI开发平台ModelArts

可以基于保存的镜像创建训练作业。 message String 镜像创建的时间，UTC毫秒。 create_time Long 镜像保存操作过程中，展示构建信息。请求示例如下以查询uuid为2cd88daa-31a4-40a8-a58f-d186b0e93e4f的训练作业对应worker-0镜像保存任务为例。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
停止训练作业版本 - AI开发平台ModelArts

error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。请求示例如下以停止“job_id”为10，“version_id”为10的作业版本为例。 POST htt

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
代码运行常见错误 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？开发环境提示空间不足，如何解决？如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？ JupyterLab中文件保存失败，如何解决？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

镜像构建及调试与单机单卡相同。上传镜像，参考单机单卡训练的上传镜像章节操作。准备数据登录coco数据集下载官网地址：https://cocodataset.org/#download 下载coco2017数据集的Train（18GB）、Val images（1GB）、Train/Val

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
在Notebook中上传文件失败，如何解决？ - AI开发平台ModelArts

受限，需要解决内网的问题。其他问题现象的可能原因如下：无OBS访问授权。无OBS桶或文件的访问权限。 OBS桶被删除。解决方案检查委托授权请前往权限管理，查看是否具有OBS访问授权。如果没有，请参考配置访问授权（全局配置）。请确认是否有OBS桶的访问权限进入OBS

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

导入模型如何将Keras的.h5格式模型导入到ModelArts中导入模型时，模型配置文件中的安装包依赖参数如何编写？使用自定义镜像创建在线服务，如何修改默认端口 ModelArts平台是否支持多模型导入导入AI应用对于镜像大小的限制父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理

总条数： 2339

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业进程被kill - AI开发平台ModelArts

应用示例 - AI开发平台ModelArts

批量删除样本 - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

更新节点池 - AI开发平台ModelArts

AIGC模型训练推理 - AI开发平台ModelArts

创建网络 - AI开发平台ModelArts

开发Workflow命令参考 - AI开发平台ModelArts

文件上传下载 - AI开发平台ModelArts

Notebook实例常见错误 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

准备模型训练代码 - AI开发平台ModelArts

在Notebook中使用Moxing命令 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询训练作业镜像保存任务 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

代码运行常见错误 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

在Notebook中上传文件失败，如何解决？ - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线