AI开发平台MODELARTS-查看日志和性能:查看性能
查看性能
训练性能主要通过训练日志中的2个指标查看,吞吐量和loss收敛情况。
- 吞吐量(tokens/s/p):可通过表1表格中output_dir参数值路径下的trainer_log.jsonl计算性能。取中间过程多steps平均值吞吐计算公式为:
delta_tokens = end_total_tokens-start_ total_tokens
delta_time = end_elapsed_time - start_elapsed_time
吞吐值(tps) = delta_tokens / delta_time / 训练卡数
如图所示:
- loss收敛情况:日志里存在lm loss参数 ,lm loss参数随着训练迭代周期持续性减小,并逐渐趋于稳定平缓。loss收敛图存放路径对应表1表格中output_dir参数值路径下的training_loss.png中也可以使用可视化工具TrainingLogParser查看loss收敛情况,将trainer_log.jsonl文件长传至可视化工具页面,如图2所示。
单节点训练:训练过程中的loss直接打印在窗口上。
多节点训练:训练过程中的loss打印在第一个节点上。
注:ppo训练结束不会打印性能。建议根据保存路径下的trainer_log.jsonl文件的最后一行总的训练steps和时间来判断性能
- 如何实时查看日志_日志管理平台_日志服务-华为云
- GaussDB性能_性能统计_高斯数据库性能-华为云
- GaussDB性能_Gaussdb数据库性能_高斯数据库性能-华为云
- 应用性能管理优势_性能诊断_ 应用性能管理 APM-华为云
- GaussDB性能怎么调_华为gaussdb_gaussdb性能_gaussdb学习
- GaussDB性能怎么调_GaussDB性能调优_高斯数据库性能怎么调-华为云
- 性能测试使用教程_性能测试操作步骤_性能测试快速入门-华为云
- GaussDB查看表字段_GaussDB查看表所在节点_高斯数据库查看表字段-华为云
- 应用性能管理APM_应用性能_功能简介
- 什么是性能测试_性能测试作用_性能测试 CodeArts PerfTest-华为云