zl程序教程

您现在的位置是:首页 >  其它

当前栏目

KDE(Kernel Density Estimation)(核密度估计)是什么?

什么 Kernel KDE estimation
2023-09-14 09:06:08 时间

基本知识:

因此,一句话概括,核密度估计Kernel Density Estimation(KDE)是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。

总而言之,核密度就是用来估计密度的,如果你有一系列空间点数据,想看哪里密度高、哪里密度低,那么核密度估计往往是比较好的可视化方法

例如下图b,就可以知道QED属性的概率密度:处于0.0-1.0之间的哪些数比较多

 

在密度函数估计中有一种方法是被广泛应用的——直方图。如下图中的第一和第二幅图(名为Histogram和Histogram, bins shifted)。直方图的特点是简单易懂,但缺点在于以下三个方面:密度函数是不平滑的;密度函数受子区间(即每个直方体)宽度影响很大,同样的原始数据如果取不同的子区间范围,那么展示的结果可能是完全不同的。如下图中的前两个图,第二个图只是在第一个图的基础上,划分区间增加了0.75,但展现出的密度函数却看起来差异很大;直方图最多只能展示2维数据,如果维度更多则无法有效展示。

核密度估计有两种内核(平滑内核和不平滑内核,图3(Tophat Kernl Density)为不平滑内核,图4(Gaussian Kernel Density,bandwidth=0.75)为平滑内核。在很多情况下,平滑内核(如高斯核密度估计,Gaussian Kernel Density)使用场景较多。

虽然采用不同的核函数都可以获得一致性的结论(整体趋势和密度分布规律性基本一致),但核密度函数也不是完美的。除了核算法的选择外,带宽(bandwidth)也会影响密度估计,过大或过小的带宽值都会影响估计结果。如上图中的最后三个图,名为Gaussian Kernel Density,bandwidth=0.75、Gaussian Kernel Density,bandwidth=0.25、Gaussian Kernel Density,bandwidth=0.55.


非参数估计:核密度估计KDE_-柚子皮-的博客-CSDN博客_核密度估计

什么是核密度估计?如何感性认识? - 知乎