您现在的位置是：首页 > 其他

当前栏目

R语言数据挖掘2.2.5　基于最大频繁项集的GenMax算法

算法集合语言代码

2023-03-09 22:22:28 时间

2.2.5　基于最大频繁项集的GenMax算法

GenMax算法用来挖掘最大频繁项集（Maximal Frequent Itemset，MFI）。算法应用了最大性特性，即增加多步来检查最大频繁项集而不只是频繁项集。这部分基于Eclat算法的事物编号集合交集运算。差集用于快速频繁检验。它是两个对应项目的事物编号集合的差。

可以通过候选最大频繁项集的定义来确定它。假定最大频繁项集记为M，若X属于M，且X是新得到频繁项集Y的超集，则Y被丢弃；然而，若X是Y的子集，则将X从集合M中移除。

下面是调用GenMax算法前的伪代码，

M← ，且P←{<Xi, t(Xi)>|Xi∈D, support_count(Xi)≥MIN_SUP}

其中，D是输入事务数据集。

R语言实现

GenMax算法的主要部分的R语言代码如下所示：

猜你喜欢

大数据分享：60多个有用的数据可视化图形库
JavaScript、PHP、Python等5款主流编程语言爆安全漏洞
探讨Java中最常见的十道面试题(超经典)
企业选择数据湖架构的5大理由
详解大数据处理中的Lambda架构和Kappa架构
世界上好用的开发语言！PHP-开源CMS大比拼
大数据分析师学习入门，10个数据可视化技巧
用Python从零开始构造决策树
从源码解密Spark内存管理
Python基础原理：FP-growth算法的构建
智能数据降低业务成本的7种方法
Python将被加入高考科目
辨析BI、数据仓库、数据湖和数据中台内涵及差异点
用Python连接MySQL的几种姿势
文旅部将出台规定在线旅游“大数据杀熟”或被处罚
商业智能停车的三大好处
数据分析常用的18个概念，终于有人讲明白了！
Go在酷狗数据库中间件的应用
最全的C++资源大全，纯干货！
一个简单的算法，分布式系统的性能瞬间被提升10倍以上

zl程序教程

当前栏目

R语言数据挖掘2.2.5　基于最大频繁项集的GenMax算法

相关文章

当前栏目

R语言数据挖掘2.2.5 基于最大频繁项集的GenMax算法

相关文章

R语言数据挖掘2.2.5　基于最大频繁项集的GenMax算法