您现在的位置是：首页 > IT要闻

当前栏目

机器学习中的数学——距离定义（二十六）：Wasserstein距离（Wasserstei Distance）/EM距离（Earth-Mover Distance）

学习

2023-04-18 16:24:23 时间

Wasserstein距离也被称为推土机距离（Earth Mover’s Distance，EMD），用来表示两个分布的相似程度。Wasserstein距离衡量了把数据从分布 $p$ 移动成”分布 $q$ 时所需要移动的平均距离的最小值。Wasserstein距离是2000年IJCV期刊文章《The Earth Mover’s Distance as a Metric for Image Retrieval》提出的一种直方图相似度量。如果两个分布 $p$ 和 $q$ 离得很远，完全没有重叠的时候，那么KL散度值是没有意义的，而JS散度值是一个常数。这在学习算法中是比较致命的，这就意味这这一点的梯度为0，即梯度消失，而Wasserstein距离可以解决这个问题。

我们将两个分布 $p$ 和 $q$ 看成两堆土，如下图所示，希望把其中的一堆土移成另一堆土的位置和形状，有很多种可能的方案。推土代价被定义为移动土的量乘以土移动的距离，在所有的方案中，存在一种推土代价最小的方案，这个代价就称为两个分布的Wasserstein距离。

Wasserstein距离的形式化的表达式如下：
$q)=inf_{gammasimprod(p,q)}E_{x, ysimgamma}[||x-y||]$

其中， $\prod (p, q)$ 表示分布 $p$ 和 $q$ 组合起来的所有可能的联合分布的集合。对于每一个可能的联合分布 $γ$ 可以从中采样 $(x, y) \sim γ$ 得到一个样本 $x$ 和 $$ y，并计算出这对样本的距离 $∣ ∣ x - y ∣ ∣$ ，所以可以计算该联合分布 $γ$ 下，样本对距离的期望值 $E_{x, ysimgamma}[||x-y||]$ 。在所有可能的联合分布中能够对这个期望值取到的下界就是Wasserstein距离。用推土的方式理解就是， $E_{x, ysimgamma}[||x-y||]$ 是在 $γ$ 这种路径规划下，把 $p$ 这堆土，移成 $q$ 的样子的消耗，而Wasserstein距离就是在”最优路径规划“下的最小消耗。

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

当前栏目

机器学习中的数学——距离定义（二十六）：Wasserstein距离（Wasserstei Distance）/EM距离（Earth-Mover Distance）

相关文章