Data - 【转】数据统计、数据挖掘、大数据、OLAP的区别
2023-09-14 08:59:09 时间
数据分析
数据分析是一个大的概念,理论上任何对数据进行计算、处理从而得出一些有意义的结论的过程,都叫数据分析。
从数据本身的复杂程度、以及对数据进行处理的复杂度和深度来看,可以把数据分析分为以下4个层次:数据统计,OLAP,数据挖掘,大数据。
-
数据统计
数据统计是最基本、最传统的数据分析,自古有之。是指通过统计学方法对数据进行排序、筛选、运算、统计等处理,从而得出一些有意义的结论。
举例,对全年级学生按照平均成绩从高到低排序,前10%的学生可以获得申请研究生免试资格。 -
OLAP
联机分析处理(On-Line Analytical Processing,OLAP)是指基于数据仓库的在线多维统计分析。它允许用户在线地从多个维度观察某个度量值,从而为决策提供支持。
举例,学校招生时要决定今年在江苏的招生指标,不能简单地参照去年的计划,而是要参考多个维度的数据积累。学校要在这些数据的支持下做出合理的决策。 -
数据挖掘
数据挖掘是指从海量数据中找到人们未知的、可能有用的、隐藏的规则,可以通过关联分析、聚类分析、时序分析等各种算法发现一些无法通过观察图表得出的深层次原因。
举例,学校发现高等数学等主干课的不及格率有逐年上升的趋势,一般认为是学习不认真所致,但做了很多工作效果并不明县,这时通过数据挖掘…… -
大数据
大数据是指用现有的计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的数据集。
大数据具有规模大、种类杂、快速化、价值密度低等特点(4V特性)。大数据的“大”是一个相对概念,没有具体标准,如果一定要给一个标准,那么10-100TB通常称为大数据的门槛。
大数据、人工智能与数据科学
相关文章
- 数据透视表上线!如何在纯前端实现这个强大的数据分析功能?
- 图解Kafka中的数据采集和统计机制 | 文末送30本书任你选[通俗易懂]
- sql分别用日期、月、年 分组 group by 分组,datepart函数,datediff函数 统计
- 使用umami搭建免费的个人博客数据统计系统
- 贝叶斯地理统计模型R-INLA-3
- Typecho 网站总访客数统计加在线人数代码
- 【Linux 内核 内存管理】Linux 内核内存布局 ③ ( Linux 内核 动态分配内存 系统接口函数 | 统计输出 vmalloc 分配的内存 )
- 从零开始搭建一个免费的个人博客数据统计系统(umami + Vercel + Heroku)
- sql server如何利用开窗函数over()进行分组统计
- MongoDB 中聚合统计计算–$SUM表达式
- 如何用shell脚本分析网站日志统计PV、404、500等数据详解程序员
- Kafka项目实战-用户日志上报实时统计之应用概述详解大数据
- MySQL的周统计:洞悉数据的内涵(mysql按周统计数据)
- 使用Mysql统计查询数据的技巧(mysql条件统计)
- 数据统计MySQL实现工资数据统计分析(mysql工资)
- 利用Redis提升数据统计效率(利用redis缓存做统计)
- 利用Redis加速数据统计的精准性(利用redis做数据统计)
- Mysql数据变化对比两年统计分析(mysql两年对比统计)
- MySQL两字段求和函数,轻松完成数据统计(mysql两字段求和函数)
- 统计Oracle HR号码统计聚焦洞察人力资源数据(oracle hr 号码)
- MYSQL中统计查询结果总行数的便捷方法省去count(*)
- php和jquery实现地图区域数据统计展示数据示例
- 单个select语句实现MySQL查询统计次数