您现在的位置是：首页 > 其他

当前栏目

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

规则算法支持关联挖掘数据挖掘频繁性质

2023-06-13 09:17:48 时间

文章目录

参考博客 :

一、非频繁项集超集性质

关联规则性质 1 : 非频繁项集的超集一定是非频繁的 ;

超集就是包含该集合的集合 ;

项集

\rm X

是非频繁项集 ,

项集

\rm Y

是项集

\rm X

的超集 ,

( 使用集合表示 :

\rm X \subseteq Y , X \not= \varnothing

, 项集

\rm Y

包含项集

\rm X

, 并且项集

\rm X

不为空集 )

则项集

\rm Y

一定是非频繁的 ;

举例 :

数据集

\rm D

为 :

事物编号	事物 ( 商品 )
001 001 001	奶粉 , 莴苣
002 002 002	莴苣 , 尿布 , 啤酒 , 甜菜
003 003 003	奶粉 , 尿布 , 啤酒 , 橙汁
004 004 004	奶粉 , 莴苣 , 尿布 , 啤酒
005 005 005	奶粉 , 莴苣 , 尿布 , 橙汁

001

奶粉 , 莴苣

002

莴苣 , 尿布 , 啤酒 , 甜菜

003

奶粉 , 尿布 , 啤酒 , 橙汁

004

奶粉 , 莴苣 , 尿布 , 啤酒

005

奶粉 , 莴苣 , 尿布 , 橙汁

项集

\{ 甜菜 \}

项集

\{ 甜菜 , 啤酒 \}

上述

\{ 甜菜 , 啤酒 \}

就是

\{ 甜菜 \}

的超集 ,

项集

\{ 甜菜 \}

其支持度是

\rm 0.2

, 小于最小支持度

\rm minsup = 0.6

, 是非频繁项集

那么

\{ 甜菜 , 啤酒 \}

也是非频繁项集 ;

在具体算法中会使用该性质 , 用于进行 “剪枝” 操作 ;

计算支持度时 , 按照

项集支持度 ,

\cdots

顺序进行计算 ,

如果发现

项集中有非频繁项集 , 则包含该

项集的

\rm n

项集肯定是非频繁项集 ;

然后使用频繁

项集组合成

项集 , 然后再计算这些

项集是否是频繁项集 ;

“剪枝” 操作减少了不必要的计算量 ;

二、频繁项集子集性质

频繁项集的所有非空子集 , 一定是频繁项集 ;

项集

\rm Y

是频繁项集 ,

项集

\rm Y

是项集

\rm X

的超集 ,

( 使用集合表示 :

\rm X \subseteq Y , X \not= \varnothing

, 项集

\rm Y

包含项集

\rm X

, 并且项集

\rm X

不为空集 )

则项集

\rm X

一定是频繁的 ;

举例 :

数据集

\rm D

为 :

事物编号	事物 ( 商品 )
001 001 001	奶粉 , 莴苣
002 002 002	莴苣 , 尿布 , 啤酒 , 甜菜
003 003 003	奶粉 , 尿布 , 啤酒 , 橙汁
004 004 004	奶粉 , 莴苣 , 尿布 , 啤酒
005 005 005	奶粉 , 莴苣 , 尿布 , 橙汁

001

奶粉 , 莴苣

002

莴苣 , 尿布 , 啤酒 , 甜菜

003

奶粉 , 尿布 , 啤酒 , 橙汁

004

奶粉 , 莴苣 , 尿布 , 啤酒

005

奶粉 , 莴苣 , 尿布 , 橙汁

项集

\{ 尿布 \}

\{ 啤酒 \}

项集

\{ 尿布 , 啤酒 \}

项集

\{ 尿布 , 啤酒 \}

其支持度是

\rm 0.6

, 等于最小支持度

\rm minsup = 0.6

, 是频繁项集

那么

项集

\{ 尿布 , 啤酒 \}

的子集是

项集

\{ 尿布 \}

\{ 啤酒 \}

根据上述性质 ,

项集

\{ 尿布 \}

\{ 啤酒 \}

都是频繁项集 ;

三、项集与超集支持度性质

任意一个项集的支持度 , 都大于等于其超集支持度 ;

超集就是包含该集合的集合 ;

猜你喜欢

生信学习小组Day2笔记-Chocolate Ice
C++不知算法系列之集结基础算法思想
基于Redis的优化运维框架（redis 运维框架）
怎么办解决Linux系统权限不够问题（linux下权限不够）
SQL Server分割表：提高数据库性能（sqlserver分割表）
辉瑞已召回12批次存在致癌风险的戒烟药畅沛
Oracle中国发布最新新闻与进展（oracle中国最新动态）
RocketMQ消息存储
ORA-24412: Cannot reinitialize non-existent pool ORACLE 报错故障修复远程处理
Oracle 指南智慧指引未来（guid oracle）
Oracle官方培训机构：解锁技能，开启职业生涯（oracle官方培训机构）
MySQL Error number: MY-013754; Symbol: ER_WARN_REPLICA_ANONYMOUS_TO_GTID_UUID_SAME_AS_VIEW_CHANGE_UUID; SQLSTATE: HY000 报错故障修复远程处理
架构师应该遵守的编程原则
jquery关于checkbox选中和不选中的问题
主机虚拟化技术搭建MySQL优化系统（主机虚拟机mysql）
MySQL三表查询筛选技巧分享（mysql 三表筛选）
第十四届蓝桥杯集训——练习解题阶段(无序阶段)-ALGO-194 审美课
库NC破解给Oracle数据库带来新变化（nc是oracle数据）

zl程序教程

当前栏目

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

文章目录

一、非频繁项集超集性质

二、频繁项集子集性质

三、项集与超集支持度性质

相关文章

当前栏目

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

文章目录

一、 非频繁项集超集性质

二、 频繁项集子集性质

三、 项集与超集支持度性质

相关文章

一、非频繁项集超集性质

二、频繁项集子集性质

三、项集与超集支持度性质