AI开发平台MODELARTS-如何在ModelArts上获得RANK_TABLE_FILE进行分布式训练?

时间:2024-11-06 21:52:49

如何在ModelArts上获得RANK_TABLE_FILE进行分布式训练?

ModelArts会帮用户生成RANK_TABLE_FILE文件,可通过环境变量查看文件位置。

  • 在Notebook中打开terminal,可以运行如下命令查看RANK_TABLE_FILE:
    1
    env | grep RANK 
    
  • 在训练作业中,您可以在训练启动脚本的首行加入如下代码,把RANK_TABLE_FILE的值打印出来:
    1
    os.system('env | grep RANK')
    
support.huaweicloud.com/modelarts_faq/modelarts_05_0380.html