您现在的位置是：首页 > 硬件

当前栏目

（《机器学习》完整版系列）第14章概率图模型——14.2 马尔可夫随机场（无向图，“团”与“极大团”，MRF的“三性”）

机器学习系列模型 14 概率完整版极大

2023-09-11 14:14:53 时间

马尔可夫随机场MRF是无向图模型，对于一个一般的无向图，我们可以对其“分解”：拆成“局部”是全连接的子图，这就引入了“团”（clique）与“极大团”的概念，“团”（全连接的子图）有对应的“势”（场的“因子”）。
全连接（任意两结点间都有连接）是很特殊的无向图，它可视为一个整体，可以用联合分布概率表刻画，再去掉和为一的概率限制，即为用势函数来刻画。

马尔可夫随机场

我们知道，在有向图模型中，箭头线代表依赖关系，因而可用条件概率来刻画，然而，马尔可夫随机场MRF是无向图模型，故条件概率就不适用了。

全连接（任意两结点间都有连接）是很特殊的无向图，它可视为一个整体，可以用联合分布概率表刻画，再去掉和为一的概率限制，即为用势函数来刻画。势函数模式通过规范化即可得到概率。

那么，对于一个一般的无向图，我们可以对其“分解”：拆成“局部”是全连接的子图，这就引入了“团”（clique）与“极大团”的概念，“团”（全连接的子图）有对应的“势”（场的“因子”）。观察【西瓜书图14.2】知，团的分解中，团是集合，团与团之间可能有元素相同。对极大团分解也是一样的。

注：由于团与因子对应，为减少因子，故通常“极小团”为相连的两结点构成的子图，但链式马尔可夫随机场时，没有成三角形的团，相连的两结点构成“极大团”，为增加因子，这时，将“极小团”定义为一个结点构成，如，式(14.27)。

模型一定是基于某种假设的，MRF的假设之一就是：将图进行团（或极大团）分解，整个图的概率（结点的联合概率）能“分解为”（正比例于）多个因子的乘积，而每个因子（势函数）对应一个团（或极大团）。

因此，MRF中的 $n$ 个变量 $\boldsymbol{\mathrm{x}}=\{x_1,x_2,\cdots,x_n\}$ （注意，它不是向量，而是图中结点的集合，集合记号： $\boldsymbol{\mathrm{x}}=\{x_1,x_2,\cdots,x_n\}$ ，向量记号： $\boldsymbol{{x}}=(x_1,x_2,\cdots,x_n)$ ）的联合分布概率 $P(\boldsymbol{\mathrm{x}})$ 有两种定义：基于团分解的定义【西瓜书式(14.2)】和基于极大团分解的定义【西瓜书式(14.3)】，其中，含有规范化因子（概率化因子） $\mathrm{Z}$ 或 $\mathrm{Z}^*$ 。显然，两定义并不兼容（不相等），从因子个数的角度来看，前者多于后者（因为极大团也是团），所以，应根据应用的实际情况来选用哪个定义。

对【西瓜书式(14.2)】两边求基于 $\boldsymbol{\mathrm{x}}$ 的和
$\begin{align} \sum_{\substack{(x_1,x_2,\cdots,x_n)\\\text{的各种取值组合}}}P(\boldsymbol{\mathrm{x}}) & =\sum_{\substack{(x_1,x_2,\cdots,x_n)\\\text{的各种取值组合}}}\frac{1}{\mathrm{Z}}\prod _{Q\in \mathcal{C}} \psi _Q(\boldsymbol{\mathrm{x}}_Q)\notag \\ 1 & =\frac{1}{\mathrm{Z}}\sum_{\substack{(x_1,x_2,\cdots,x_n)\\\text{的各种取值组合}}}\prod _{Q\in \mathcal{C}} \psi _Q(\boldsymbol{\mathrm{x}}_Q)\notag \\ {\mathrm{Z}} & =\sum_{\substack{(x_1,x_2,\cdots,x_n)\\\text{的各种取值组合}}}\prod _{Q\in \mathcal{C}} \psi _Q(\boldsymbol{\mathrm{x}}_Q)\notag \\ {\mathrm{Z}} & =\sum_{\boldsymbol{\mathrm{x}}}\prod _{Q\in \mathcal{C}} \psi _Q(\boldsymbol{\mathrm{x}}_Q) \tag{14.16} \end{align}$
其中， $\sum_{\boldsymbol{\mathrm{x}}}$ 不是从 $x_1$ 到 $x_n$ 求和，而是 $\sum_{\substack{(x_1,x_2,\cdots,x_n)\\\text{的各种取值组合}}}$ 。

对【西瓜书式(14.3)】同样处理，就可到了 ${\mathrm{Z}}^*$ 的式子。

MRF中团是子图，若两个子图没有公共结点，则它俩是“分离”的，它俩被谁分离呢？【西瓜书图14.3】所示， $C$ 是 $A$ 和 $B$ 的分离集。

MRF的“三性”：

（1）全局马尔可夫性：即在以分离集为条件时，被分离的集是独立的，如，【西瓜书图14.3】中有此情况，记为： $\boldsymbol{\mathrm{x}}_A\perp \boldsymbol{\mathrm{x}}_B\,|\,\boldsymbol{\mathrm{x}}_C$ ，【西瓜书式(14.7)】在简单情况下进行了验证。

（2）局部马尔可夫性：对于MRF中的任意结点 $v$ ，将它拎起来，以其为根，形成一棵“树”（之所以带引号，是由于不是真正的树，如，可能有横向的或跨层的连接）。
图14.5 局部马尔可夫性

图14.5 局部马尔可夫性

如图图14.5 局部马尔可夫性所示，该“树”分为三部分，其中 $A$ 与 $B$ 被 $C$ 分离：

$A$ ：根 $v$ 结点。
$C$ ：第一层 $n (v)$ ，称为 $v$ 的邻接。
$B$ ：其余部分，即 $V\setminus (\{v\}\cup n(v))$ 。

则由全局马尔可夫性，有： $\boldsymbol{\mathrm{x}}_A\perp \boldsymbol{\mathrm{x}}_B\,|\,\boldsymbol{\mathrm{x}}_C$ ，即： $\boldsymbol{\mathrm{x}}_v\perp \boldsymbol{\mathrm{x}}_{V\setminus (\{v\}\cup n(v))}\,|\,\boldsymbol{\mathrm{x}}_{n(v)}$ 。

（3）成对马尔可夫性：设想将MRF图放入水中，将不相连的两点 $u, v$ 拎出水面，如图14.6 所示：
图14.6 成对马尔可夫性

图14.6 成对马尔可夫性

则由全局马尔可夫性，有： $\boldsymbol{\mathrm{x}}_u\perp \boldsymbol{\mathrm{x}}_v\,|\,\boldsymbol{\mathrm{x}}_{V\setminus \{u,v\}}$ 。

再考虑如何设计团 $Q$ 的势函数 $\psi _Q(\boldsymbol{\mathrm{x}}_Q)$ 。

i. 先看团的能量：

规模的难度（点）：质点越多，能量越大，因此，团的能量函数应对团上的点进行累加。
成团的难度（边）：团内任意一对质点相互作用，产生能量（或正或负的），因此，团的能量函数应对团上“点对”的作用进行累加。注意：“点对”在团中是连接（团内是全连接的）。
还要考虑实际问题的偏好，即：对不同的点、不同的“点对”赋予不同的权重。

由此可用实值函数 $_Q(\boldsymbol{\mathrm{x}}_Q)$ 【西瓜书式(14.9)】表示团的能量，其中，第一个和号反映团的“点对”的能量，第二个和号反映团的点的能量。团的能量体现了团形成的难度：规模越大，联合出现的概率越小。

ii. 由MRF模型的假设所定义的【西瓜书式(14.2)】和【西瓜书式(14.3)】知，应以位势（势）来描述团的概率，即团的势正比例于团的变量联合出现的概率，再由i. 知，团的势与团的能量应成“反比”关系，因此，可定义团上的能量为负对数位势。
$\begin{align} H _Q(\boldsymbol{\mathrm{x}}_Q)=-\mathrm{ln}\,\psi _Q(\boldsymbol{\mathrm{x}}_Q) \tag{14.18} \end{align}$
即
$\begin{align} \psi _Q(\boldsymbol{\mathrm{x}}_Q)=\mathrm{e}^{-H _Q(\boldsymbol{\mathrm{x}}_Q)} \tag{14.19} \end{align}$
注1：“反比”关系参见10.10 度量学习图10.2 至图10.5 的讨论。
注2：这里涉及“团”的三个概念的关系：能量，位势和概率。

综上，知道了MRF的图，就可以做图的团（或极大团）分解；再在团上定义势函数后，就可以利用【西瓜书式(14.2)】或【西瓜书式(14.3)】求出 $P(\boldsymbol{\mathrm{x}})$ ，求出 $P(\boldsymbol{\mathrm{x}})$ 后就可以认为求出了 $\boldsymbol{\mathrm{x}}$ ，因为，一旦需要 $\boldsymbol{\mathrm{x}}$ 的具体值，即可以通过仿真（采样）生成，这即是“生成式模型”，即求联合分布 $P(\boldsymbol{\mathrm{x}})$ ，在13.1 生成式方法详解，我们讨论了基于“生成式模型”求参数的生成式方法，而“判别式模型”（如判别类别等），则求条件分布 $P(y\,|\,\boldsymbol{\mathrm{x}})$ 。马尔可夫随机场为“生成式模型”，条件随机场为“判别式模型”。

本文为原创，您可以：

点赞（支持博主）
收藏（待以后看）
转发（他考研或学习，正需要）
评论（或讨论）
引用（支持原创）
不侵权

上一篇：14.1 隐马尔可夫模型HMM（状态变量（隐的）、观测变量（可见））
下一篇：14.3 学习与推断之变量消去法（“边际化”，“m化”逐步消元）

猜你喜欢

I2C系统的重要结构体
Hi~"自霉体人"，阿里巴巴UC订阅号发布会强势来袭
XXX为什么选择红黑树？
Ubuntu 18.04.4修改hostname
从“什么是程序化购买”到“程序化购买+”
SAP CRM, C4C和Hybris Commerce的数据迁移策略
Spring4 MVC表单验证代码示例
Ubuntu16.04编译Android5.1源码
DL之NN：NN算法(本地数据集50000张训练集图片)进阶优化之三种参数改进，进一步提高手写数字图片识别的准确率
Python 初识二叉树，新手也秒懂！
极客时间-左耳听风-程序员攻略-程序员修养
基于DDD的.NET开发框架 - ABP初探
【安装包】VC++6.0
idea集成scala插件
EXCEL函数常用技巧浅析
可视化gRPC语言堆栈
怎样让1+1=3？
未知宽高元素怎么上下左右垂直居中

相关主题

机器学习——感知机
机器学习模型评估
机器学习算法分类
机器学习-视频
机器学习过程

zl程序教程

当前栏目

（《机器学习》完整版系列）第14章概率图模型——14.2 马尔可夫随机场（无向图，“团”与“极大团”，MRF的“三性”）

马尔可夫随机场

相关文章

当前栏目

（《机器学习》完整版系列）第14章 概率图模型——14.2 马尔可夫随机场（无向图，“团”与“极大团”，MRF的“三性”）

马尔可夫随机场

相关文章

（《机器学习》完整版系列）第14章概率图模型——14.2 马尔可夫随机场（无向图，“团”与“极大团”，MRF的“三性”）