昨天深夜,实验室的师弟发来一条消息:“师兄,YOLOv11训了50个epoch,mAP一直在0.12附近震荡,loss曲线像心电图,怎么办?”配图是TensorBoard里那条令人绝望的波动曲线。这场景太熟悉了——每个认真调过模型的人,大概都曾在凌晨面对过类似的困境。训练不收敛、过拟合、指标震荡……这些问题看似基础,却往往消耗我们大量的调试时间。今天我们就来拆解这些“训练病”,聊聊怎么对症下药。一、Loss不下降:模型根本没在学习看到loss曲线平得像条高速公路,先别急着调学习率。我习惯按这个顺序排查:检查数据加载是否正确# 常见坑:标签没对齐forbatch_idx,(images,targets)inenumerate(train_loader