时间序列-异常检测(Anomaly Detection)(二):传统方法
2023-09-27 14:20:37 时间
一、基于统计的算法(具有分布假设)
1、针对单变量数据
1.1 集中不等式
集中不等式是数学中的一类不等式,描述了一个随机变量是否集中在某个取值附近
1.2 马尔可夫不等式
给出了一个实值随机变量取值大于等于某个特定数值的概率的上限。设X是一个随机变量,a>0为正实数,那么以下不等式成立:
1.3 比切雪夫不等式
马尔可夫不等式给出了随机变量处于区间 [a,+inf] 概率的上限估计。切比雪夫不等式则给出了随机变量集中在距离其数学期望值距离不超过a的区间上之概率的上限估计:
1.4 统计置信度检验
1.5 3-sigma
(μ−3σ,μ+3σ)区间内的概率为99.74。所以可以认为,当数据分布区间超过这个区间时,即可认为是异常数据。n-sigma异常检测准则:
1.
相关文章
- 由遍历序列构造二叉树--王道
- 机器学习笔记二-----------------Prophet(时间序列模型)的复杂例程笔记及给jupyter添加多个python版本的kernel的方法
- 时间序列-预测-模型:LSTM【单特征/多特征】【利用前50个时间步的数值预测接下来的10个时间步的数值:(0-49)->50;(1-50此50为上一步预测出的)->51;(2-51)->52...】
- Pandas-时间序列(二)-索引及切片:TimeSeries是Series的一个子类,所以Series索引及数据选取方面的方法基本一样【TimeSeries通过时间序列有更便捷的方法做索引和切片】
- 不通过删除重建方式,重置序列值的简单方法
- oracle导出序列的几种办法
- 栈的压入、弹出序列
- oracle 序列中cache 有什么用途
- C语言序列点浅析
- hdu1710-Binary Tree Traversals (由二叉树的先序序列和中序序列求后序序列)
- JAVA基础 XML生成与解析和String包装类下 .replace方法的使用以及char和字符序列的使用场景
- 【Python】初识 元组:可变序列 和 不可变序列
- 1281:最长上升子序列
- LeetCode·106.从中序与后序遍历序列构造二叉树·递归
- NLP自然语言处理系列-时间序列数据分析-创建时期对象、时期的频率转换、重采样方法
- 时间序列的归一化方法
- mybatis以序列周期,同样处理的这个问题的价值
- .NET(C#) Json字符串反序列化成dynamic类型对象的方法代码
- 最长上升子序列(两种方法)
- 最长上升子序列(两种方法)
- [LeetCode] 300. Longest Increasing Subsequence 最长递增子序列
- 2018-10-19-C#-序列类为-xml-可以使用的特性大全
- Python_序列对象内置方法详解_String