盘古大模型 PANGULARGEMODELS-查看训练任务详情与训练指标:训练损失值指标介绍

时间:2024-09-05 14:59:05

训练损失值指标介绍

训练损失值(Training Loss)是一种衡量模型预测结果和真实结果差距的指标,通常情况下越小越好。

一般来说,一个正常的Loss曲线是单调递减的,即随着训练的进行,Loss值不断减小,直到收敛到一个较小的值。以下给出了几种正常的Loss曲线形式:

图2 正常的Loss曲线:平滑下降
图3 正常的Loss曲线:阶梯下降

如果您发现Loss曲线出现了以下几种情况,可能意味着模型训练状态不正常:

  • Loss曲线上升:Loss曲线上升的原因可能是数据质量差,或学习率设置过大,使得模型在最优解附近震荡,甚至跳过最优解,导致无法收敛。您可以尝试提升数据质量或减小学习率来解决。
    图4 异常的Loss曲线:上升
  • Loss曲线平缓,保持高位:Loss曲线平缓且保持高位不下降的原因可能是目标任务的难度较大,或模型的学习率设置过小,导致模型的收敛速度太慢,无法达到最优解。您可以尝试增大训练轮数或者增大学习率来解决。
    图5 异常的Loss曲线:平缓且保持高位
  • Loss曲线异常抖动:Loss曲线异常抖动的原因可能是训练数据质量差,比如数据存在噪声或分布不均衡,导致训练不稳定。您可以尝试提升数据质量来解决。
    图6 异常的Loss曲线:异常抖动
support.huaweicloud.com/ugobs-obs-pangulm/pangulm_03_0054.html