R语言数据挖掘2.2.5 基于最大频繁项集的GenMax算法
2023-03-09 22:22:28 时间
2.2.5 基于最大频繁项集的GenMax算法
GenMax算法用来挖掘最大频繁项集(Maximal Frequent Itemset,MFI)。算法应用了最大性特性,即增加多步来检查最大频繁项集而不只是频繁项集。这部分基于Eclat算法的事物编号集合交集运算。差集用于快速频繁检验。它是两个对应项目的事物编号集合的差。
可以通过候选最大频繁项集的定义来确定它。假定最大频繁项集记为M,若X属于M,且X是新得到频繁项集Y的超集,则Y被丢弃;然而,若X是Y的子集,则将X从集合M中移除。
下面是调用GenMax算法前的伪代码,
M← ,且P←{<Xi, t(Xi)>|Xi∈D, support_count(Xi)≥MIN_SUP}
其中,D是输入事务数据集。
R语言实现
GenMax算法的主要部分的R语言代码如下所示:
相关文章
- Linux内存管理(Golang实现)
- Go语言切片原生支持并发吗?
- 为什么进程使用的内存尺寸(虚拟存储)可以比物理内存还大?
- GitHub与GitLab有何不同,您该选那个?
- 面试突击:线程安全问题是如何产生的?
- Vue2剥丝抽茧-响应式系统之数组
- Firefox 火狐浏览器 105 工具栏正测试统一管理扩展按钮
- 如何清理 Snap 保留的旧软件包以释放磁盘空间
- Linux 怎么防止 ssh 被暴力破解
- Vue2剥丝抽茧-响应式系统完善
- Vue.js设计与实现-框架设计的核心要素
- 苹果 M2 MacBook Pro Safari 浏览器性能测试:有史以来最快速度
- 如何在基于 Ubuntu 的 Linux 发行版上安装最新的 Vim 9.0
- 编译实战 | 手把手教你在Windows环境下运行Redis6.x
- 基于OpenHarmony Native Api框架实现控制LED灯亮灭
- HarmonyOS3.0尝鲜之关键Js Api--ServiceAbility开发
- 开发成功GitOps模型的三个步骤
- 为有经验用户量身定制的 Linux
- CORS为什么能保障安全?为什么只对复杂请求做预检?
- Linux Mint 21 “Vanessa” 的十大特色