-
创建新版Notebook无法使用已购买的专属资源池,如何解决? - AI开发平台ModelArts
创建新版Notebook无法使用已购买的专属资源池,如何解决? 问题现象 已购买专属资源池,但创建Notebook时该资源池不可选择,无法创建Notebook。 提示当前专属资源池未初始化开发环境,请到专属资源池页面初始化开发环境。 原因分析 新购买的专属资源池,需要初始化环境才能用于创建Notebook。
-
训练过程中无法找到so文件 - AI开发平台ModelArts
训练过程中无法找到so文件 问题现象 ModelArts训练作业运行时,日志中遇到如下报错,导致训练失败: libcudart.so.9.0 cannot open shared object file no such file or directory 原因分析 编译生成s
-
配置了合理的服务部署超时时间,服务还是部署失败,无法启动 - AI开发平台ModelArts
配置了合理的服务部署超时时间,服务还是部署失败,无法启动 服务部署成功的标志是模型启动完成,如果没有配置健康检查,就无法检测到模型是否真实的启动。 在自定义镜像健康检查接口中,用户可以实现实际业务是否成功的检测。在创建AI应用时配置健康检查延迟时间,保证容器服务的初始化。 因此,推荐在创建AI应用时配置健康检查,并设置合理的延迟检测时间,
-
日志提示”Compile graph failed.” - AI开发平台ModelArts
日志提示”Compile graph failed.” 问题现象 日志提示“Compile graph failed.”。 图1 报错提示 原因分析 模型转换时未指定Ascend后端。 处理方法 需要在模型转换阶段指定“--device=Ascend”。 父主题: 常见问题
-
管理AI应用版本 - AI开发平台ModelArts
除后不可恢复,请谨慎操作。 删除AI应用 在“AI应用”页面,单击AI应用“操作”列的“删除”,即可删除对应的AI应用。 如果AI应用的版本已经部署服务,需先删除关联的服务后再执行删除操作。AI应用删除后不可恢复,请谨慎操作。 父主题: 管理AI应用
-
管理AI应用简介 - AI开发平台ModelArts
从模板中选择元模型 查看AI应用详情 当AI应用创建成功后,您可以进入AI应用详情页查看AI应用的信息。 管理AI应用版本 为方便溯源和模型反复调优,在ModelArts中提供了AI应用版本管理的功能,您可以基于版本对AI应用进行管理。 发布AI应用 针对在ModelArts创建的AI应用,支持发布至AI
-
ModelArts中提示OBS路径错误 - AI开发平台ModelArts
确保此OBS桶的加密功能关闭。如果此OBS桶为加密桶,可单击“默认加密”选项进行修改。 创建OBS桶时,桶的存储类别请勿选择“归档存储”和“深度归档存储”,归档存储的OBS桶会导致模型训练失败。 图1 查看OBS桶是否加密 检查OBS文件是否为加密文件 进入OBS管理控制台,单击桶名称进入概览页。
-
AI应用管理 - AI开发平台ModelArts
AI应用管理 创建AI应用失败,如何定位和处理问题? 导入AI应用提示该账号受限或者没有操作权限 用户创建AI应用时构建镜像或导入文件失败 创建AI应用时,OBS文件目录对应镜像里面的目录结构是什么样的? 通过OBS导入AI应用时,如何编写打印日志代码才能在ModelArts日志查询界面看到日志
-
训练作业中使用os.system('cd xxx')无法进入相应的文件夹? - AI开发平台ModelArts
训练作业中使用os.system('cd xxx')无法进入相应的文件夹? 当在训练作业的启动脚本中使用os.system('cd xxx')无法进入相应的文件夹时,建议使用如下方法: import os os.chdir('/home/work/user-job-dir/xxx')
-
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts
MA_JOB_DIR}/training/。 假设训练代码的OBS目录为obs://bucket-A/XXX/{training-project}/,“{training-project}”是存放训练代码的文件夹名称。训练时会自动下载OBS中{training-project}目
-
日志提示“ Network is unreachable” - AI开发平台ModelArts
日志提示“ Network is unreachable” 问题现象 在使用pytorch时,将torchvision.models中的pretrained置为了True,日志中出现如下报错: ‘OSError: [Errno 101] Network is unreachable’
-
从对象存储服务(OBS)中选择元模型 - AI开发平台ModelArts
元模型来源参数说明 参数 说明 “选择元模型” 选择元模型存储的OBS路径。 OBS路径不能含有空格,否则创建AI应用会失败。 “AI引擎” 根据您选择的元模型存储路径,将自动关联出元模型使用的“AI引擎”。 如果“AI引擎”是Custom引擎时,需要配置容器调用接口,用于指定模
-
测试服务 - AI开发平台ModelArts
测试服务 AI应用部署为在线服务成功后,您可以在“预测”页签进行代码调试或添加文件测试。根据AI应用定义的输入请求不同(JSON文本或文件),测试服务包括如下两种方式: JSON文本预测:如当前部署服务的AI应用,其输入类型指定的为JSON文本类,即不含有文件类型的输入,可以在“
-
创建AI应用 - AI开发平台ModelArts
创建AI应用 从训练中选择元模型 从模板中选择元模型 从对象存储服务(OBS)中选择元模型 从容器镜像中选择元模型 父主题: 管理AI应用
-
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” 问题现象 使用mindspore进行训练时,出现如下报错: [ERROR] RUNTIME(3002)model execute error, retCode=0x91
-
用户创建AI应用时构建镜像或导入文件失败 - AI开发平台ModelArts
用户创建AI应用时构建镜像或导入文件失败 问题现象 用户创建AI应用时,构建镜像失败,失败日志中提示下载obs文件失败(Get object size from OBS failed!)。 图1 下载obs文件失败 用户创建AI应用时,事件提示:复制模型文件失败,请检查OBS权限是否正常(Failed
-
子用户使用专属资源池创建训练作业无法选择已有的SFS Turbo - AI开发平台ModelArts
子用户使用专属资源池创建训练作业无法选择已有的SFS Turbo 由于权限不足,导致子用户无法看到已有的SFS Turbo,请为子用户所在用户组添加SFS FullAccess 、SFS Trubo FullAccess权限。 父主题: 功能咨询
-
开发AI应用 - AI开发平台ModelArts
开发AI应用 准备模型 AI应用开发的前序步骤是模型训练,因此开始进行AI应用开发时,您已经有训练优化好的可使用的模型了。当前ModelBox 镜像支持的模型类型有TensorRT和PyTorch模型,具体的版本号在您创建开发环境选择镜像时镜像名称中可以看到。 如果您的模型不是T
-
作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts
作为调用发起方的客户端无法访问已经获取到的推理请求地址 问题现象 完成在线服务部署且服务处于“运行中”状态后,已经通过调用指南页面的信息获取到调用的server端地址,但是调用发起方的客户端访问该地址不通,出现无法连接、域名无法解析的现象。 原因分析 在调用指南页签中显示的调用地
-
删除AI应用 - AI开发平台ModelArts
删除AI应用 功能介绍 删除AI应用,根据AI应用ID删除指定AI应用,cascade取值为true时除了删除AI应用ID指定的AI应用,还会删除其他与指定AI应用同名不同版本的AI应用;默认只删除当前AI应用ID所对应的AI应用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API