(《机器学习》完整版系列)第15章 规则学习——15.1 命题规则(逻辑学、布尔表达)
规则学习:对样本的标记规律进行归纳总结、并进行演绎推理,得出(逻辑)规则。
以命题形式的规则表达,由“条件”得到“结论”。
从集合论的角度来看,具有蕴涵(包含)关系。
“条件”可能分解为若干“子条件”,需要它们同时成立。
通过真值表可以定义语义。
命题规则
首先,我们看以命题形式的规则表达
if (条件) then (结论)
\begin{align} \text{if\ (条件)\ then\ (结论)} \tag{15.1} \end{align}
if (条件) then (结论)(15.1)
式(15.1)中由“条件”得到“结论”,从集合论的角度来看,该“条件”除了能得到该“结论”外,可能还会得到其他什么结论,故具有蕴涵(包含)关系
结论
⊆
条件
\begin{align} \text{结论$\subseteq$条件} \tag{15.2} \end{align}
结论⊆条件(15.2)
用逻辑学中的符号,则为
“结论”
←
“条件”
\begin{align} \text{“结论”$\leftarrow$“条件”} \tag{15.3} \end{align}
“结论”←“条件”(15.3)
对于二分类问题,“结论”通常取“正例”(或“正例集”),用
⨁
\bigoplus
⨁表示,而“条件”可能分解为若干“子条件”,需要它们同时成立,这时,上述两式分别为
⊕
⊆
f
1
∩
f
2
∩
⋯
∩
f
L
\begin{align} \oplus \subseteq \boldsymbol{f}_1\cap \boldsymbol{f}_2\cap \cdots \cap \boldsymbol{f}_L \tag{15.4} \end{align}
⊕⊆f1∩f2∩⋯∩fL(15.4)
⊕
←
f
1
∧
f
2
∧
⋯
∧
f
L
\begin{align} \oplus \leftarrow \boldsymbol{f}_1\land \boldsymbol{f}_2\land \cdots \land \boldsymbol{f}_L \tag{15.5} \end{align}
⊕←f1∧f2∧⋯∧fL(15.5)
其中,
f
1
\boldsymbol{f}_1
f1可以是布尔表达式,例如,关于西瓜属性的表达对应是这样的:(色泽=乌黑)、
¬
\lnot
¬(根蒂=硬挺)。
有五个连接符号: ¬ \lnot ¬(否定), ∧ \land ∧(合取), ∨ \lor ∨(析取), ← \leftarrow ←(蕴涵), ↔ \leftrightarrow ↔(等价)。 而“逻辑连词”与布尔代数及集合论中的符号具有对应关系(如,上述式(15.5)与式(15.4)对应)。
式(15.5)中 f 1 ∧ f 2 ∧ ⋯ ∧ f L \boldsymbol{f}_1\land \boldsymbol{f}_2\land \cdots \land \boldsymbol{f}_L f1∧f2∧⋯∧fL表示条件同时满足,称为合取式(合取( ⋀ \bigwedge ⋀)是指同时满足,类似于集合的“交”;析取( ⋁ \bigvee ⋁)是指至少满足其一,类似于集合的“并”),而 f 1 ∨ f 2 ∨ ⋯ ∨ f L \boldsymbol{f}_1\lor \boldsymbol{f}_2\lor \cdots \lor \boldsymbol{f}_L f1∨f2∨⋯∨fL表示至少满足一个条件,称为析取式。
通过真值表可以定义其语义,如,表15.1 中,每行的第2、3、4列为
α
,
β
,
γ
\alpha ,\beta ,\gamma
α,β,γ的一个真值指派(因变量赋值),第5列对应于
α
∧
β
\alpha \wedge \beta
α∧β的语义(变量的定义),整个表则是完整的因变量真值指派及表达式值定义。
式(15.5)是单一合取式,若使用“析合范式”将有更强的表达能力,我们以【西瓜书表1.1】数据为例,讨论“析合范式”表达的假设空间。
设数据集有3个属性(不妨抽象成
a
a
a,
b
b
b,
c
c
c)每个属性3个值(分别以下标1,2,3表示,并有通配符“
∗
*
∗”),【西瓜书图1.2】已得到了“版本空间”,根据这里的记号,则“版本空间”为
{
(
a
∗
∧
b
1
∧
c
∗
)
,
(
a
∗
∧
b
∗
∧
c
1
)
,
(
a
∗
∧
b
1
∧
c
1
)
}
\begin{equation} \{ (a_*\wedge b_1\wedge c_*),(a_*\wedge b_*\wedge c_1),(a_*\wedge b_1\wedge c_1) \} \tag{15.6} \end{equation}
{(a∗∧b1∧c∗),(a∗∧b∗∧c1),(a∗∧b1∧c1)}(15.6)
“版本空间”中的任一“版本”都是任务的一个解,即都是训练出的预测器,可用于进行预测。
1)在某种偏好下,保留符合训练样本的节点,如:删除与正例不一致的节点(当然,这是默认的偏好,也可以用“满足负例”作为偏好,当以既“满足正例”又“满足负例”作为偏好时,必须加上二者冲突时的偏好选择);
2)再去掉两种极端情况(删除对预测不起实质作用的假设),即删除未泛化的叶(如, ( a 1 , b 1 , c 1 ) (a_1,b_1,c_1) (a1,b1,c1))和删除泛化过度的根(如, ( a ∗ , b ∗ , c ∗ ) (a_*,b_*,c_*) (a∗,b∗,c∗))。
式(15.6)中每一个就只含一个合取式(的析合范式)。
二个合取式的析合范式为从式(15.6)中任取两个合取式再进行析取,再考虑到吸收律(如
(
a
∗
∧
b
∗
∧
c
1
)
∨
(
a
∗
∧
b
1
∧
c
1
)
=
(
a
∗
∧
b
∗
∧
c
1
)
(a_*\wedge b_*\wedge c_1)\vee (a_*\wedge b_1\wedge c_1)=(a_*\wedge b_*\wedge c_1)
(a∗∧b∗∧c1)∨(a∗∧b1∧c1)=(a∗∧b∗∧c1),其中
b
∗
b_*
b∗吸收了
b
1
b_1
b1),故只有
(
a
∗
∧
b
1
∧
c
∗
)
∨
(
a
∗
∧
b
∗
∧
c
1
)
\begin{equation} (a_*\wedge b_1\wedge c_*)\vee (a_*\wedge b_*\wedge c_1) \tag{15.7} \end{equation}
(a∗∧b1∧c∗)∨(a∗∧b∗∧c1)(15.7)
又将式(15.6)中三个合取式进行析取,由吸收律仍得到式(15.7),故没有含三个(及以上)合取式的析合范式假设。
本文为原创,您可以:
- 点赞(支持博主)
- 收藏(待以后看)
- 转发(他考研或学习,正需要)
- 评论(或讨论)
- 引用(支持原创)
- 不侵权
相关文章
- 6-机器学习进阶_指针网络_递归结构
- 机器学习一一主成分分析法
- (《机器学习》完整版系列)第8章 集成学习——8.6 级联集成(Stacking算法、其他级联)
- (《机器学习》完整版系列)1-2 简化现实世界
- 大数据与机器学习:实践方法与行业案例3.4 自动加载程序的多线程实现
- 机器学习算法集锦:从贝叶斯到深度学习及各自优缺点
- 超详细!上线一个机器学习项目你需要哪些准备?
- 谷歌机器学习规则要点简析:43条黄金法则
- 推荐 | 掌握这12条经验,对理解机器学习至关重要!
- 周志华 机器学习 笔记
- Python机器学习零基础理解K近邻算法
- 纳德拉指出,机器学习能力将成为云计算的战场
- 【历史上的今天】5 月 11 日:Dijkstra 算法开发者诞生;电子表格软件的开山鼻祖;机器狗 AIBO 问世
- Oracle引入机器学习、AI保障云安全服务