您现在的位置是：首页 > 其他

当前栏目

R语言数据挖掘2.1.2.1　关联规则

语言数据

2023-03-09 22:22:18 时间

2.1.2.1　关联规则

关联分析可以从海量数据集中发现有意义的关系，这种关系可以表示成关联规则的形式或频繁项集的形式。具体的关联分析算法将在后面一个章节中给出。

关联规则挖掘旨在发现给定数据集（事务数据集或其他序列-模式-类型数据集）中的结果规则集合。给定预先定义的最小支持度计数s和置信度c，给定已发现的规则X→Y support_count (X→Y)≥s且confidence (X→Y)≥c。

当X∩Y=（X、Y不相交），则X→Y是关联规则。规则的兴趣度通过支持度（support）和置信度（confidence）来测量。支持度表示数据集中规则出现的频率，而置信度测量在X出现的前提下，Y出现的可能性。

对于关联规则，衡量规则可用性的核心度量是规则的支持度和置信度。两者之间的关系是：

support_count(X)是数据集中包含X的项集数。

通常，在support_count(X)中，支持度和置信度的值表示为0～100的百分数。

给定最小支持度阈值s和最小置信度阈值c。如果support_count (X→Y) > s且confidence (X→Y)≥c，则关联规则X→Y称为强规则。

对于关联规则含义的解释应当慎重，尤其是当不能确定地判断规则是否意味着因果关系时。它只说明规则的前件和后件同时发生。以下是可能遇到不同种类的规则：

布尔关联规则：若规则包含项出现的关联关系，则称为布尔关联规则。

单维关联规则：若规则最多包含一个维度，则为单维关联规则。

多维关联规则：若规则至少涉及两个维度，则为多维关联规则。

相关关联规则：若关系或规则是通过统计相关进行测量的，满足给定的相关性规则，则称为相关关联规则。

定量关联规则：若规则中至少一个项或属性是定量的，则称为定量关联规则。

猜你喜欢

边缘计算对于下一阶段智慧城市规划的意义
阿里云服务器送域名吗
数据湖构建DLF数据探索快速入门-淘宝用户行为分析
边缘(Edge)应用技术将惠及所有行业
腾讯云服务器不备案吗
域名和网站空间费用是多少
《Tomcat安装与使用》
ecs使用体验报告
Docker为什么“输”给了Kubernetes？
为什么在采用公共云之前需要深思熟虑
云原生应用持续交付入门:基于云效部署java应用到kubernetes集群
数据中心投资者需要知道什么
apipost自动化测试工具
又一个NFT域名成交，半年身价暴涨数百倍！
飞天加速计划ECS初使用体验
操作实践一识别计算机硬件
国别域名invest.ae以48万元交易价领衔sedo榜！
一个三字母域名预告以1291万售出，或许跟NFT市场的“疯狂”有关？
项目二认识计算机硬件设备
在搭建网站前，先看看云服务器与虚拟主机的四个区别

zl程序教程

当前栏目

R语言数据挖掘2.1.2.1　关联规则

相关文章

当前栏目

R语言数据挖掘2.1.2.1 关联规则

相关文章

R语言数据挖掘2.1.2.1　关联规则