zl程序教程

您现在的位置是:首页 >  后端

当前栏目

『 迷你教程 』数据异常检测你没有听过的隔离森林和核密度方法

方法教程异常数据 检测 没有 隔离 森林
2023-09-11 14:18:26 时间

异常检测是为了发现偏离常态的数据点。换句话说,这些点并不遵循预期的模式。离群值和异常值是用来描述异常数据的术语。异常检测在许多领域都很重要,因为它可以提供有价值和可操作的见解。例如,MR成像扫描的异常可能表明大脑中的肿瘤区域,而制造工厂传感器的异常读数可能表明损坏的部件。
在这里插入图片描述

异常检测

离群值只是一个与特定数据集中的其他数据点有很大差异的数据点。类似地异常检测是帮助识别数据异常值的过程,或与其他大量数据点有很大偏差的点。

当涉及到大型数据集时,可能会有非常复杂的模式,仅仅通过查看数据是无法检测到的。因此为了实现关键的机器学习应用,对异常检测的研究具有重要的意义。

异常类型

在数据科学领域,有三种不同的方法来对异常进行分类。正确理解它们可能会对您处理异常的方式产生重大影响。

  • 点或全局异常:与其余数据点显着不同的数据点,全局异常被认为是最常见的异常形式。通常发