R语言数据挖掘2.2.5 基于最大频繁项集的GenMax算法
2023-09-11 14:16:03 时间
GenMax算法用来挖掘最大频繁项集(Maximal Frequent Itemset,MFI)。算法应用了最大性特性,即增加多步来检查最大频繁项集而不只是频繁项集。这部分基于Eclat算法的事物编号集合交集运算。差集用于快速频繁检验。它是两个对应项目的事物编号集合的差。
可以通过候选最大频繁项集的定义来确定它。假定最大频繁项集记为M,若X属于M,且X是新得到频繁项集Y的超集,则Y被丢弃;然而,若X是Y的子集,则将X从集合M中移除。
下面是调用GenMax算法前的伪代码,
M← ,且P←{ Xi, t(Xi) |Xi∈D, support_count(Xi)≥MIN_SUP}
其中,D是输入事务数据集。
R语言实现
GenMax算法的主要部分的R语言代码如下所示:
相关文章
- R语言数据挖掘2.2.4.2 FP-growth算法
- 《R语言数据挖掘》——2.6 高性能算法
- 《机器学习与R语言(原书第2版)》一3.2 例子—用kNN算法诊断乳腺癌
- [算法]二叉搜索树与双向链表
- 《趣题学算法》—第1章1.3节加法原理和乘法原理
- 算法是问题解决步骤的描述,与具体语言无关
- 面向过程编程的致命缺陷是算法与算法的结合方式过于单一,面向对象和函数式编程都是对这一缺陷的改进
- 程序员保值的4个秘密(要当语言和框架方面的专家,高难技术,业务,算法,产品意识与思维(把细节做好))
- 浅谈网络流Dinic算法
- 华为OD机试 - 统计匹配的二元组个数(Python) | 机试题+算法思路+考点+代码解析 【2023】
- Go语言排序算法实现
- Go语言二叉树定义及遍历算法实现
- 经常使用排序算法
- 跳跃的舞者,舞蹈链(Dancing Links)算法——求解精确覆盖问题
- 这你能相信?有人用Java、Python、C、C++、Go、JS等等各种语言把所有算法实现了一遍
- 群里兄弟量化测试数据。技术大牛,用到Kafka,GO语言,机器学习算法