-
导入AI应用提示该账号受限或者没有操作权限 - AI开发平台ModelArts
导入AI应用提示该账号受限或者没有操作权限 问题现象 在导入AI应用时,提示用户账号受限。 原因分析 提示用户账号受限,常见原因有如下几种: 导入AI应用账号欠费导致被冻结; 导入AI应用账号没有对应工作空间的权限; 导入AI应用账号为子账号,主账号没有给子账号赋予AI应用相关权限。
-
导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts
导入AI应用提示单个模型文件超过5G限制 问题现象 在导入AI应用时,提示单个模型文件大小超过5G限制。 原因分析 在不使用动态加载的情况下,系统对单个模型文件的限制大小为5G,超过时无法进行导入。 处理方法 精简模型文件后,重新导入。 使用动态加载功能进行导入。 图1 使用动态加载
-
导入AI应用提示模型或镜像大小超过限制 - AI开发平台ModelArts
导入AI应用提示模型或镜像大小超过限制 问题现象 在导入AI应用时,提示模型或镜像大小超过限制。 原因分析 如果使用的是OBS导入或者训练导入,则是基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和超过了限制。 如果使用的是自定义镜像导入,则是解压后镜像和镜像下载文件的大小总和超过了限制。
-
创建AI应用失败,提示模型镜像构建任务超时,没有构建日志 - AI开发平台ModelArts
创建AI应用失败,提示模型镜像构建任务超时,没有构建日志 问题现象 创建AI应用失败,构建日志提示超时“Model image build task timed out”,没有详细构建日志。 图1 模型镜像构建任务超时 原因分析 imagePacker构建镜像有超时时间限制,默认
-
通过OBS创建AI应用时,构建日志中提示pip下载包失败 - AI开发平台ModelArts
通过OBS创建AI应用时,构建日志中提示pip下载包失败 问题现象 通过OBS创建AI应用构建失败,查看构建日志,提示pip下载包失败。如下载numpy 1.16版本失败。 原因分析 一般下载包失败时,可能有如下几个原因: pip源中不存在该包,当前默认pip源为pypi.org中的包,请在pypi
-
日志提示“Please set the train - AI开发平台ModelArts
日志提示“Please set the train_url to an empty obs directory” 问题现象 日志提示“Please set the train_url to an empty obs directory”。 原因分析 对于不支持断点训练的模型,若选
-
日志提示”Compile graph failed.” - AI开发平台ModelArts
日志提示”Compile graph failed.” 问题现象 日志提示“Compile graph failed.”。 图1 报错提示 原因分析 模型转换时未指定Ascend后端。 处理方法 需要在模型转换阶段指定“--device=Ascend”。 父主题: 常见问题
-
ModelArts中提示OBS路径错误 - AI开发平台ModelArts
确保此OBS桶的加密功能关闭。如果此OBS桶为加密桶,可单击“默认加密”选项进行修改。 创建OBS桶时,桶的存储类别请勿选择“归档存储”和“深度归档存储”,归档存储的OBS桶会导致模型训练失败。 图1 查看OBS桶是否加密 检查OBS文件是否为加密文件 进入OBS管理控制台,单击桶名称进入概览页。
-
从对象存储服务(OBS)中选择元模型 - AI开发平台ModelArts
元模型来源参数说明 参数 说明 “选择元模型” 选择元模型存储的OBS路径。 OBS路径不能含有空格,否则创建AI应用会失败。 “AI引擎” 根据您选择的元模型存储路径,将自动关联出元模型使用的“AI引擎”。 如果“AI引擎”是Custom引擎时,需要配置容器调用接口,用于指定模
-
管理AI应用版本 - AI开发平台ModelArts
除后不可恢复,请谨慎操作。 删除AI应用 在“AI应用”页面,单击AI应用“操作”列的“删除”,即可删除对应的AI应用。 如果AI应用的版本已经部署服务,需先删除关联的服务后再执行删除操作。AI应用删除后不可恢复,请谨慎操作。 父主题: 管理AI应用
-
测试服务 - AI开发平台ModelArts
测试服务 AI应用部署为在线服务成功后,您可以在“预测”页签进行代码调试或添加文件测试。根据AI应用定义的输入请求不同(JSON文本或文件),测试服务包括如下两种方式: JSON文本预测:如当前部署服务的AI应用,其输入类型指定的为JSON文本类,即不含有文件类型的输入,可以在“
-
管理AI应用简介 - AI开发平台ModelArts
版本对AI应用进行管理。 发布AI应用 针对在ModelArts创建的AI应用,支持发布至AI Gallery、发布至AI云商店或发布至AI大赛。 订阅模型 ModelArts服务支持用户从AI Gallery中订阅官方发布或者他人分享的模型,支持从其他EI云服务订阅AI应用。订阅后的模型,在“ModelArts
-
日志提示“ Network is unreachable” - AI开发平台ModelArts
日志提示“ Network is unreachable” 问题现象 在使用pytorch时,将torchvision.models中的pretrained置为了True,日志中出现如下报错: ‘OSError: [Errno 101] Network is unreachable’
-
Notebook提示磁盘空间已满 - AI开发平台ModelArts
足。 磁盘配额不足。 处理方法 查看虚拟机所使用的存储空间,再查看回收站文件占用内存,根据实际删除回收站里不需要的大文件。 在Notebook实例详情页,查看实例的存储容量。 执行如下命令,排查虚拟机所使用的存储空间,一般接近存储容量,请排查回收站占用内存。 cd /home/ma-user/work
-
为什么无法启动训练? - AI开发平台ModelArts
为什么无法启动训练? 如果启动脚本选择了不属于本工程的代码,则无法启动训练,错误信息如下图所示。建议将启动脚本添加至本工程,或者是打开启动脚本所在工程后,再启动训练作业。 图1 错误信息 父主题: PyCharm Toolkit使用
-
AI应用管理 - AI开发平台ModelArts
AI应用管理 创建AI应用失败,如何定位和处理问题? 导入AI应用提示该账号受限或者没有操作权限 用户创建AI应用时构建镜像或导入文件失败 创建AI应用时,OBS文件目录对应镜像里面的目录结构是什么样的? 通过OBS导入AI应用时,如何编写打印日志代码才能在ModelArts日志查询界面看到日志
-
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts
MA_JOB_DIR}/training/。 假设训练代码的OBS目录为obs://bucket-A/XXX/{training-project}/,“{training-project}”是存放训练代码的文件夹名称。训练时会自动下载OBS中{training-project}目
-
创建AI应用 - AI开发平台ModelArts
创建AI应用 从训练中选择元模型 从模板中选择元模型 从对象存储服务(OBS)中选择元模型 从容器镜像中选择元模型 父主题: 管理AI应用
-
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” 问题现象 使用mindspore进行训练时,出现如下报错: [ERROR] RUNTIME(3002)model execute error, retCode=0x91
-
日志提示“No space left on device” - AI开发平台ModelArts
达到50G,只有默认的10GB,导致作业训练失败。 实际存储空间足够,却依旧报错“No Space left on device”。 同一目录下创建较多文件,为了加快文件检索速度,内核会创建一个索引表,短时间内创建较多文件时,会导致索引表达到上限,进而报错。 触发条件和下面的因素有关: