开放数据:数据也可以实行共产主义
大数据与开放数据有着千丝万缕的联系,但两者并不是一回事儿。开放数据为大数据的合理开发利用提供了一个新途径,并在一定程度上降低了大数据的风险。
大数据是根据其体量来界定的,而开放数据的界定则是根据其用途。大数据指体量巨大、种类复杂,同时又在迅速变化的数据集。但这些关于大数据的评定具有很强的主观性,受限于人类现有的技术:随着数据分析和计算技术水平的发展,几年之后,我们现在所谓的大数据也就称不上是大数据了。
开放数据是可利用的公共数据,个体、公司和机构都能根据这些数据进行投融资,分析其中的模式与趋势,根据数据进行决策,解决复杂棘手的问题。开放数据的定义有两个维度:一是数据对任何人公开,二是通过某种方式授权数据的再利用。除了“开放性”之外,开放数据的使用门槛也要相对降低。同时,人们就开放数据的费用问题已达成了基本共识,即免费或是尽量低的价格。
大数据与开放数据的关联
上面的维恩图展现了大数据与公开数据之间的关联,以及它们与广义上的政府公开数据之间的关系。这其中有几点需要重点介绍一下。
只有开放的大数据才能称之为大众化、民主化的数据:其中的第一点包括了所有未公开的大数据--如零售巨头保留的顾客数据,或是NSA收集的国家安全数据。拥有此类数据的机构具有非对称的优势,却可能使剩下的我们毫无安全感可言。这一类数据所引起的争议也愈来愈大。
开放数据不一定是大数据:正如图表中的第四点所示,公开化的少量数据也可能带来巨大的影响力。例如,地方政府公开的数据有助于公民更多地了解参与地方预算,选择医保方案,权衡地方服务水平,或是据此开发公共交通辅助app.
大数据和开放数据并不一定来自于政府公开数据:如第三点所示,越来越多的科学家开始将航天、地理或其他领域的成果以一种新的,合作研究的方式共享。另外还有其他一些研究人员利用社交媒体上的数据--其中大部分都是公开的--分析舆情和市场趋势。
政府一旦把它所掌握的大数据公开化,这将会给整个社会带来不可估量的影响:政府机构有足够的能力和资金收集大量数据(如图表中的第六点所示),此类数据库的公开将会带来巨大的经济效益。根据现有的资料,在美国,大约有500家企业利用政府公开数据进行商业运作,而其中的多数数据是大数据。
利用开放数据的原则去开发大数据可以解决大数据所面临的很多问题。其中最重要的一点便是隐私性个人化数据的开发利用可能难以得到数据主体,亦即我们自身的许可和认可。而将敏感数据以特定方式,或可控的方式公开化,可能会在一定程度上提高数据的安全性。
因此,目前的问题不仅是政府和某些商业机构一直在收集个人信息,而更严峻的是,我们对于自身的哪些数据被收集一无所知,也无权查看被收集的数据。如果我们了解得更多,我们可控的也就更多。英国政府制定的midata计划,鼓励大型商业机构与顾客共享其用户数据,这不失为开放数据的创新性举措。美国也有类似的项目,如Blue Button医疗数据公开方案,以及Green Button能源使用数据方案,这些都收到了积极效果。
大数据与开放数据都将会对商业、政府和社会带来革命性的影响,而两者相结合的潜力更是不可估量。大数据赋予我们理解分析,并最终改变世界的能力。开放数据将这种能力公开共享--被我们所改变的世界将朝着更加公平、更加民主的方向发展。
原文发布时间为:2014-05-05
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号
数据安全审查综合解读|如何从被动合规到主动战略风控? 8月27日,《数据安全法》解读与阿里云三大合规方案线上直播活动完美收官。阿里云高级安全咨询专家李娜对数据安全相关法律法规做了综合解读,她指出,数据安全合规不能仅看片面,需要有整体的数据安全观,知其然也要知其所以然,真正做到从被动合规到主动战略风控。
【活动】数据质量与数据治理的发展趋势、政策标准、技术方法和实践应用全在这了! 9月10日,第四届数据质量管理国际峰会将在北京举行,届时阿里数据的高级数据技术专家王伟将会在现场分享来自阿里巴巴的数据质量与管理经验。
“链”上信任和效率,“跨境贸易风险监测与可信溯源”平台新版即将上线 区块链不应局限在某单一领域,而应该落地到方方面面的应用场景当中,即将上线的“跨境贸易风险监测与可信溯源”平台新版旨在赋能各个行业,提高效率、降低成本、重塑流程和推动数字化。
网络安全等级保护2.0制度的变化和对公有云用户的要求 2019年5月13日,国家市场监督管理总局、国家标准化管理委员会召开新闻发布会,正式发布了等保2.0相关的《信息安全技术网络安全等级保护基本要求》、《信息安全技术网络安全等级保护测评要求》、《信息安全技术网络安全等级保护安全设计技术要求》等国家标准。
短视频开发业务是否受到国家监管影响?规范内容才能走的更远 “中国网络视听节目服务协会于1月9日发布了《网络短视频内容审核标准细则》和《网络短视频平台管理规范》,加大了对短视频的审核和监管力度。网络短视频平台管理规范》规定,网络短视频平台应当履行版权保护责任,未经授权不得自行剪切、改编电影、电视剧、网络电影、网络剧等各类广播电视视听作品;不得转发UGC上传的电影、电视剧、网络电影、网络剧等各类广播电视视听作品片段等。
企业建设什么样的网站才能符合用户? 如今建一个网站相对之前,无论是技术方面,还是用户需求方面都取得了一定的进展,一个好的网站不仅仅需要在技术方面获得突破,更重要是具备一定传播价值以及能不能满足用户的需求。那企业建设什么样的网站才能符合用户呢?
相关文章
- WPF MVVM UI分离之《交互与数据分离》 基础才是重中之重~delegate里的Invoke和BeginInvoke 将不确定变为确定系列~目录(“机器最能证明一切”) 爱上MVC3系列~全局异常处理与异常日志 基础才是重中之重~lock和monitor的区别 将不确定变成确定~我想监视我的对象,如果是某个值,就叫另一些方法自动运行 将不确定变成确定~LINQ DBML模型可以对
- laravel数据表填充器使用填充数据
- Google Earth Engine(GEE)——影像矢量转栅格(日本夜间灯光数据案例分析)
- Google Earth Engine(GEE)——欧盟(EU)调查土地利用/覆盖矢量(LUCAS)点数据集无需GEE也可以下载
- SQLDeveloper 转换SQL数据库到ORACLE转成功可以看到表结构没有任何数据,原因:删除了users表空间
- 从实验角度来验证混沌数据可以被预测吗?
- 32EasyUI 数据网格- 自定义分页
- 找不到完美数据科学家?你还可以组建一支数据科学梦之队
- 一个php文件就可以把数据库的数据导出Excel表格
- Python数据分析之不只是拟合数据,还要获得洞察力,轻量级的 Python包可以让您深入了解回归问题
- 一、数据
- 在深度学习的视觉VISION领域数据预处理的魔法常数magic constant、黄金数值: mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225]
- 数据预处理-数据规约
- 科学家证明他们可以在一克DNA当中存储215PB数据
- 数据中心优先:英特尔公司描述数据驱动领域的愿景
- 用大数据城市规划可以变得更好
- pandas_处理异常值缺失值重复值数据差分
- 【C语言&单片机杂谈】:char数组转换成HEX格式数据、C语言中什么情况下可以多赋值、 C语言中Switch中的 break和return的区别?C语言中类型转换?
- MEEM数据线可以在充电时备份手机数据
- 大数据如何起步?从小数据到大数据