搜索_华为云

线下容器镜像构建及调试 - AI开发平台ModelArts

线下容器镜像构建及调试构建容器镜像并调试镜像构建及调试与单机单卡相同。具体操作，请参考线下容器镜像构建及调试。上传镜像请参考单机单卡训练的上传镜像章节操作。父主题：多机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

# 配置华为云的源，安装 python、python3-pip 和 Flask RUN cp -a /etc/apt/sources.list /etc/apt/sources.list.bak && \ sed -i "s@http://.

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

原因分析通过OBS导入模型时，ModelArts会将指定的OBS目录下的所有文件和文件夹复制到镜像中的指定路径下，镜像内路径可以通过self.model_path获取。处理方法获取镜像内的路径方法见模型推理代码编写说明。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，则包含解压后镜像和镜像下载文件的大小总和。父主题： Standard推理部署

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常问题现象在部署在线服务时，部署失败。进入在线服务详情页面，“事件”页签，提示“failed to pull image, retry later”，同时在“日志”页签中，无任何信息。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配问题现象在现有镜像基础上，重新装了引擎版本，或者编译了新的CUDA包，出现如下错误： 1.

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

支持一键将运行中的Notebook实例保存为镜像，将准备好的环境保存下来，可以作为自定义镜像，方便后续使用。保存镜像，安装的依赖包不会丢失。安装完依赖包后，推荐保存镜像，避免安装的依赖包丢失。具体操作请参见保存Notebook镜像环境。父主题： Standard镜像相关

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

自定义镜像的制作要求用户对容器相关知识有比较深刻的了解，除非订阅算法和预置框架无法满足需求，否则不推荐使用。自定义镜像需上传至容器镜像服务（SWR），才能用于ModelArts Standard上训练。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

“镜像复制” 镜像复制开关，选择是否将容器镜像中的模型镜像复制到ModelArts中。关闭时，表示不复制模型镜像，可极速创建模型，更改或删除SWR源目录中的镜像会影响服务部署。开启时，表示复制模型镜像，无法极速创建模型，SWR源目录中的镜像更改或删除不影响服务部署。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
动态挂载OBS - AI开发平台ModelArts

动态挂载OBS 功能介绍在运行中的Notebook实例，支持将“OBS并行文件系统”挂载到实例中指定的文件目录，挂载后可以在容器中以文件系统操作方式完成OBS并行文件系统对象的读写。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

详细步骤如下所示：前提条件 Step1 创建OBS桶和文件夹 Step2 准备脚本文件并上传至OBS中 Step3 准备镜像主机 Step4 制作自定义镜像 Step5 上传镜像至SWR服务 Step6 在ModelArts上创建训练作业前提条件已注册华为账号并开通华为云，且在使用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

定位思路确定镜像来源确认该自定义镜像的基础镜像是否来源于ModelArts提供的基础镜像，推荐用户使用ModelArts的基础镜像构建自定义镜像，具体请参见使用ModelArts的基础镜像构建新的训练镜像。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

-obs, --obs-path TEXT OBS path to save local built image.

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
镜像保存时报错“there are processes in 'D' status, please check process status using 'ps -aux' and kill all the 'D' status processes”或“Buildimge - AI开发平台ModelArts

执行kill -9 <pid>命令将相关进程结束后，再次执行镜像保存即可。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
使用自定义镜像创建的训练作业一直处于运行中 - AI开发平台ModelArts

使用自定义镜像创建的训练作业一直处于运行中问题现象使用自定义镜像创建训练作业，训练作业的“状态”一直处于“运行中”。原因分析及处理办法日志打印如下内容，表示自定义镜像的CPU架构与资源池节点的CPU架构不一致。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
自定义镜像导入模型部署上线调用API报错 - AI开发平台ModelArts

自定义镜像导入模型部署上线调用API报错部署上线调用API报错，排查项如下：确认配置文件模型的接口定义中有没有POST方法。确认配置文件里url是否有定义路径。例如：“/predictions/poetry”（默认为“/”）。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
训练作业运行失败排查指导 - AI开发平台ModelArts

原因：Moxing在进行文件复制时，未找到train_data_obs目录。处理建议：修改train_data_obs目录为正确地址，重新启动训练作业。另外在Moxing下载OBS对象过程中，不要删除相应OBS目录下的对象，否则Moxing在下载到被删除的对象时会下载失败。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
使用自定义镜像创建训练作业找不到启动文件 - AI开发平台ModelArts

例如，当训练代码启动脚本在OBS路径为“obs://bucket-name/app/code/train.py”，创建作业时配置代码目录为“/bucket-name/app/code/”。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

修改默认端口号，具体操作如下：登录ModelArts控制台，左侧菜单选择“模型管理”；单击“创建”，进入创建模型界面，元模型选择“从容器镜像中选择”，选择自定义镜像；配置“容器调用接口”和端口号，端口号与模型配置文件中的端口保持一致；设置完成后，单击“立即创建”，等待模型状态变为

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

usr/local/cuda-11.8/lib64:/usr/local/cuda-9.1/lib64 需要手动调整优先级，执行命令export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64:$LD_LIBRARY_PATH 父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障

总条数： 1613

上一页
1
...
9
10
11
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

线下容器镜像构建及调试 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

动态挂载OBS - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

镜像保存时报错“there are processes in 'D' status, please check process status using 'ps -aux' and kill all the 'D' status processes”或“Buildimge - AI开发平台ModelArts

使用自定义镜像创建的训练作业一直处于运行中 - AI开发平台ModelArts

自定义镜像导入模型部署上线调用API报错 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

使用自定义镜像创建训练作业找不到启动文件 - AI开发平台ModelArts

在ModelArts中使用自定义镜像创建在线服务，如何修改端口？ - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线