大数据时代:统计学是数据分析的灵魂
7月中旬以来,从中央到地方,今年上半年经济社会发展的统计数据陆续进入人们的视野。在观察、使用统计数据时,类似“大数据时代怎样用好数据”这样的话题,再次引起人们的关注。
7月20日出版的《人民日报》,刊发了清华大学统计学研究中心主任刘军做客人民日报、人民网《文化讲坛》时,对相关问题所做的介绍和分析。其内容包括:
什么是数据?
数据(data)在拉丁文里是“已知”的意思,在英文中的一个解释是“一组事实的集合,从中可以分析出结论”。笼统地说,凡是用某种载体记录下来的、能反映自然界和人类社会某种信息的,就可称之为数据。古人“结绳记事”,打了结的绳子就是数据。步入现代社会,信息的种类和数量越来越丰富,载体也越来越多。数字是数据,文字是数据,图像、音频、视频等都是数据。
什么是大数据?
量的增多,是人们对大数据的第一个认识。大数据区别于数据,还在于数据的多样性。从数据到大数据,不仅是量的积累,更是质的飞跃,海量的、不同来源、不同形式、包含不同信息的数据可以容易地被整合、分析,原本孤立的数据变得互相联通。这使得人们通过数据分析,能发现小数据时代很难发现的新知识,创造新的价值。
大数据时代,统计学是数据分析的灵魂。
大数据告知信息但不解释信息。打个比方,大数据是“原油”而不是“汽油”,不能被直接拿来使用。大数据时代,统计学依然是数据分析的灵魂。正如美国加州大学伯克利分校迈克尔·乔丹教授指出的,“没有系统的数据科学作为指导的大数据研究,就如同不利用工程科学的知识来建造桥梁,很多桥梁可能会坍塌,并带来严重的后果。”
事物的发展充满了不确定性,而统计学,既研究如何从数据中把信息和规律提取出来,找出最优化的方案;也研究如何把数据当中的不确定性量化出来。
刘军的介绍与分析,帮助我们认识到,从数据到大数据,伴随质的飞跃;通过对海量数据的整合、分析,可以发现新知识、创造新价值;大数据时代,统计学肩负从数据中提取规律、量化数据中的不确定性等使命。
本文作者:水滴石
来源:51CTO
相关文章
- 动态可视化 数据可视化之魅D3,Processing,pandas数据分析,科学计算包Numpy,可视化包Matplotlib,Matlab语言可视化的工作,Matlab没有指针和引用是个大问题
- 数据分析之CE找数据大法
- Google Earth Engine ——LANDSAT/LT04/C02/T1系列数据介绍!
- 数仓建模—美团DB数据同步到数据仓库的架构与实践
- [简讯]投融资2则+俞正声“大数据提升政府治理”
- 在大数据场景下借鉴Splunk SPL的提供通用的数据分析手段
- 从大数据到安全大数据分析
- 如何保障流式处理的数据一致性
- 《数据分析变革:大数据时代精准决策之道》一第1章 了解运营型分析
- 《数据分析变革:大数据时代精准决策之道》一1.5 小结
- 《数据分析变革:大数据时代精准决策之道》一2.1 穿越炒作的迷雾
- 《数据分析变革:大数据时代精准决策之道》一第2章 更多数据……巨多数据……大数据!2.1 穿越炒作的迷雾
- 什么数据库最适合数据分析师
- 《数据分析实战:基于EXCEL和SPSS系列工具的实践》——3.2 用“逐步推进法”推测需要的数据
- CYQ.Data 轻量数据层之路 优雅V1.4版本 框架开源
- Facebook的数据预测工具Prophet有何优势?用贝叶斯推理一探究竟
- 当APP应用市场结合大数据时,将是一场风暴