搜索_华为云

创建训练作业镜像保存任务 - AI开发平台ModelArts

CREATE_FAILED：镜像保存失败。 ACTIVE：镜像保存成功，保存的镜像可以在SWR控制台查看，同时可以基于保存的镜像创建训练作业。 message String 镜像创建的时间，UTC毫秒。 create_time Long 镜像保存操作过程中，展示构建信息。请求示例

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
自定义镜像故障 - AI开发平台ModelArts

自定义镜像故障 Notebook自定义镜像故障基础排查镜像保存时报错“there are processes in 'D' status, please check process status using 'ps -aux' and kill all the 'D' status

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
查询训练作业镜像保存任务 - AI开发平台ModelArts

String 该镜像所对应的描述信息，长度限制512个字符。 status String 镜像状态。枚举值如下： INIT：初始化。 CREATING：镜像保存中，此时训练作业不可用。 CREATE_FAILED：镜像保存失败。 ACTIVE：镜像保存成功，保存的镜像可以在SWR控

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
通过自定义镜像创建模型失败 - AI开发平台ModelArts

图2 查看权限详情和去IAM修改委托权限图3 给委托添加授权将镜像设置成私有镜像登录容器镜像服务（SWR），左侧导航栏选择“我的镜像”，查看镜像详情，单击右上角“编辑”按钮，把镜像类型修改为“私有”。图4 修改镜像类型为私有父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
线下容器镜像构建及调试 - AI开发平台ModelArts

将pytorch.tar.gz上传到OBS并设置公共读，并在构建时wget获取、解压、清理。新镜像构建基础镜像一般选用ubuntu 18.04的官方镜像，或者nvidia官方提供的带cuda驱动的镜像。相关镜像直接到dockerhub官网查找即可。构建流程：安装所需的apt包、驱动，配置m

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
查询用户镜像组列表 - AI开发平台ModelArts

name String 镜像名称。 create_at Long 镜像创建的时间，UTC毫秒。 namespace String 镜像所述的SWR组织。 update_at Long 镜像最后更新的时间，UTC毫秒。 version_count Integer 镜像版本个数。请求示例

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

制作自定义镜像用于ModelArts Standard 自定义镜像使用场景 ModelArts支持的预置镜像列表制作自定义镜像用于创建Notebook 制作自定义镜像用于训练模型制作自定义镜像用于推理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
查询支持的镜像列表 - AI开发平台ModelArts

Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜像，需要指定镜像ID，ID格式为通用唯一识别码（Universally

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
用户如何设置默认的kernel？ - AI开发平台ModelArts

解决方式: 在Terminal里执行如下命令在镜像里指定环境变量。 # python-3.7.10这里指用户想设置的kernel名称 export KG_DEFAULT_KERNEL_NAME=python-3.7.10 单击操作列的“更多>保存镜像”，保存成功后然后重新启动Notebook。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
线下容器镜像构建及调试 - AI开发平台ModelArts

线下容器镜像构建及调试构建容器镜像并调试镜像构建及调试与单机单卡相同。具体操作，请参考线下容器镜像构建及调试。上传镜像请参考单机单卡训练的上传镜像章节操作。父主题：多机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入： cd /home/ma-user/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入： cd /home/ma-user/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入： cd /home/ma-user/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
LoRA微调训练 - AI开发平台ModelArts

创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的 llm_train/AscendSpeed 代码目录。图1 创建训练作业若镜像使用使用基础镜像（二选一）中的基础镜像时，训练作业启动命令中输入： cd /home/ma-use

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
LoRA微调训练 - AI开发平台ModelArts

创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入： cd /home/ma-user/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
LoRA微调训练 - AI开发平台ModelArts

创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入： cd /home/ma-user/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
导入模型提示模型或镜像大小超过限制 - AI开发平台ModelArts

导入模型提示模型或镜像大小超过限制问题现象在导入模型时，提示模型或镜像大小超过限制。原因分析如果使用的是OBS导入或者训练导入，则是基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和超过了限制。如果使用的是自定义镜像导入，则是解压后镜像和镜像下载文件的大小总和超过了限制。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

swr_path String SWR镜像地址。 tag String 镜像Tag。 type String 镜像类型。枚举值如下： BUILD_IN：系统内置镜像。 DEDICATED：用户保存的镜像。 update_at Long 镜像最后更新的时间，UTC毫秒。 visibility

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
LoRA微调训练 - AI开发平台ModelArts

创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。代码目录选择：OBS桶路径下的llm_train/AscendSpeed代码目录。图1 创建训练作业如果镜像使用使用基础镜像中的基础镜像时，训练作业启动命令中输入： cd /home/ma-user/m

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908）
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

1:8080/goodbye 如果验证自定义镜像功能成功，结果如下图所示。图3 校验接口上传自定义镜像至SWR服务。完成自定义镜像上传后，您可以在“容器镜像服务>我的镜像>自有镜像”列表中看到已上传镜像。将自定义镜像创建为模型参考从容器镜像中选择元模型导入元模型，您需要特别关注以下参数：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1533

上一页
1
...
8
9
10
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练作业镜像保存任务 - AI开发平台ModelArts

自定义镜像故障 - AI开发平台ModelArts

查询训练作业镜像保存任务 - AI开发平台ModelArts

通过自定义镜像创建模型失败 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

查询用户镜像组列表 - AI开发平台ModelArts

制作自定义镜像用于ModelArts Standard - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

用户如何设置默认的kernel？ - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

导入模型提示模型或镜像大小超过限制 - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线