AI开发平台ModelArts-复制数据至容器中空间不足:处理方法

时间:2025-02-12 15:02:57

处理方法

  1. 请排查是否将数据下载至“/cache”目录下,GPU规格资源的每个节点会有一个“/cache”目录,空间大小为4TB。并确认该目录下并发创建的文件数量是否过大,占用过多存储空间会出现inode耗尽的情况,导致空间不足。
  2. 请排查是否使用的是GPU资源。如果使用的是CPU规格的资源,“/cache”与代码目录共用10G,会造成内存不足,请更改为使用GPU资源。
  3. 请在代码中添加环境变量来解决。
    import osos.system('export TMPDIR=/cache')
support.huaweicloud.com/trouble-modelarts/modelarts_13_0043.html