盘古大模型 PANGULARGEMODELS-查看科学计算大模型训练状态与指标:获取训练日志

时间:2024-12-03 10:25:01

获取训练日志

单击训练任务名称,可以在“日志”页面查看训练过程中产生的日志。对于训练异常或失败的任务也可以通过训练日志定位训练失败的原因。典型训练报错和解决方案请参见科学计算大模型训练常见报错与解决方案

训练日志可以按照不同的节点(训练阶段)进行筛选查看。分布式训练时,任务被分配到多个工作节点上进行并行处理,每个工作节点负责处理一部分数据或执行特定的计算任务。日志也可以按照不同的工作节点(如worker-0表示第一个工作节点)进行筛选查看。

图2 获取训练日志
support.huaweicloud.com/usermanual-pangulm/pangulm_04_0188.html