zl程序教程

您现在的位置是:首页 >  后端

当前栏目

pytorch 15 模型性能分析,从loss出发到具体数据(以语义分割为例,实现深度学习中的手工TomeLinks方法)

方法性能学习数据PyTorch 实现 分析 模型
2023-09-14 09:15:04 时间

在一些特殊情况下,通过各类调参方法都无法提升模型的效果。那么则需要对模型的loss进行分析,找出其中导致模型性能下降的数据(异常数据,分类错误数据)。通过不断修正错误数据的方式,可以提升模型的性能。修正错误的分类,消除数据中的混淆对,本质上是一种TomekLinks方法。

TomekLinks是指邻近的两个相反类的例子,在深度学习中可以理解为训练数据中正例与负例混淆的情况。在没有消除TomeLinks数据时,训练模型得出的分类边界如图1左边的荧光色标记所示,弯曲而又负责,同时分类错误的数据还较多。在消除TomeLinks后,数据定义变得更加清晰,训练出的分类边界若图1右边的荧光色标记所示。

图1 TomekLinks示意图

那么在深度学习中如何找到TomekLinks对呢?在深度学习中,大部分数据都是图片,在原始数据中寻找出TomekLinks是不切实际的。因此从loss出发,当一个数据的loss值特别大,则可以认定它跟数据集中的另一个数据构成TomekLinks对(也就是异常点),修正loss值大的数据的标签(或