知识点滴 - 什么是开放数据
当你发布、提供或使用开放数据(open data)时,就会用到Public Domain Dedication and License (PDDL),公共领域专用和许可协议。关于其介绍和使用方式请参见:Open Data Commons Public Domain Dedication and License (PDDL) — Open Data Commons: legal tools for open data
"Open knowledge(开放知识 )"是指人们可以自由使用、引用和重新分发的任何内容、信息或数据--没有任何法律、技术或社会限制。
关于开放的定义(The Open Definition - Open Definition - Defining Open in Open Data, Open Content and Open Knowledge)给出了关于开放数据和内容要求的全部细节。开放数据是开放知识的组成部分。当开放数据有用、可用和使用时,就可以成为开放知识。
开放性的关键特征是:
- 可用性和访问性:数据必须是整体可用的,并且不超过合理的复制成本,最好是通过互联网下载。数据还必须以一种方便和可修改的形式提供。
- 再利用和再分发:数据必须按照允许再利用和再分发的条款提供,包括与其他数据集的混合。数据必须是计算机可处理的。
- 普遍参与:每个人都必须能够使用、引用和重新发布--不应该对工作领域或个人或团体有任何歧视。例如,不允许有阻止 "商业 "使用的 "非商业 "限制,或限制用于某些目的(如仅用于教育)。
开放数据的类型包括:
有许多种类的开放数据都有潜在的用途和应用。
- 文化:关于文化作品和人工制品的数据--例如标题和作者--通常由画廊、图书馆、档案馆和博物馆收集和持有。
- 科学:作为科学研究的一部分而产生的数据,从天文学到动物学。
- 金融:数据,如政府账户(支出和收入)和金融市场的信息(股票,股份,债券等)。
- 统计:由统计局产生的数据,如人口普查和主要社会经济指标。
- 天气:用于了解和预测天气和气候的多种类型的信息。
- 环境:与自然环境有关的信息,如污染物的存在和水平,河流和海洋的质量。
- 其他:包括交通、地理位置等数据。
为什么要开放数据?
1.透明化
在一个良好运作的社会,公民应当有比较畅通的渠道去了解政府的相关政策。通过开放数据这一渠道,公民就能够自由且免费地访问政府的数据和信息并与其他民众共享这些资讯。
透明化不仅仅是指我们能够访问信息,它还关系到公民对政务信息的知情权。这是因为,只有数据足够开放,人们才能自由地进行分析和利用这些资讯,这不仅有利于政府打造透明化、政务公开的“阳光政府”形象,还能够切实保障民众的知情权、参与权、表达权和监督权
2.释放社会价值和经济价值
在数字化时代,数据无疑是社会活动和经济活动的重要资源。无论是找到你附近的邮局还是建立一个搜索引擎都需要数据,然而很大一部分数据资源又都是政府创建和掌控的。因此,通过开放数据,政府可以激活社会创新,鼓励新的创新产品和服务,从而释放数据的社会价值和经济价值。
3.参与和互动
通过开放数据,民众能够更为直接地了解政策制定的资讯甚至直接参与政策的制定。公民不再仅仅被动接受讯息知道社会上发生什么,而且可以通过利用数据来向社会、政府直接作出自己的贡献。
开放数据 VS 公开数据
我们常常会将“开放数据”和“公开数据”这两个概念搞混。而「公开数据」是一个较宽泛的概念,泛指一切公开的数据。
那么,何谓公开的数据呢?
比如,最新的人口普查数据是公开的,工商注册数据是公开的。但这些数据严格来说目前还称不上开放数据。因为你要么无法免费获得该数据,要么该数据提供在非开放格式下(比如在纸质书籍上又或是在扫描的PDF文件里),要么是该数据不采用开放授权协议。
因此「开放数据」可以理解为一种特殊的「公开数据」。组织机构在考虑做数据开放时,一定要区分清楚「开放数据」和「公开数据」,以避免机构内和机构外对数据开放行动的误解。因此,我们可以发现,想要做到「公开数据」很简单,而做到「开放数据」则不易。
一些开放数据网站:
想要查找开发数据:
https://datasetsearch.research.google.com/
https://www.google.com/publicdata/directory
Find Open Datasets and Machine Learning Projects | Kaggle
对各个数据源的介绍:
These Are The Best Free Open Data Sources Anyone Can Use
参考:
Home — Open Data Commons: legal tools for open data
【情报百科】带你3分钟了解“开放数据”(Open Data) - 知乎
相关文章
- Scopus论文数据爬虫
- mysql中,mediunmtext字段类型用来存储什么类型的数据?最大存储多少数据?
- BI大数据到底是什么
- Google Earth Engine——流苏帽亮度(TCB)数据集该数据集由Malaria Atlas项目的Harry Gibson和Daniel Weiss制作
- 大数据可视化系列1: 可视化周期表
- 恢复生态环境,大数据能做什么?
- 比大数据还要可怕的是什么?没有数据!
- Airbnb中的数据科学家团队做什么?
- Easyui数据表格-地区列表及工具栏增删改
- DataHub: 现代数据栈的元数据平台--如何将数据血缘关系写入DataHub
- 《BI那点儿事—数据的艺术》目录索引
- MVC缓存01,使用控制器缓存或数据层缓存
- 数据绑定
- 一文看懂云计算和大数据到底是什么!
- SAP MM 物料主数据MRP2 视图’Minimum Lot Size’字段
- python代码创建Mysql数据表和导入Excel表格数据
- GPT 5模型背后的以数据为中心的 AI 概念是什么? 剖析 ChatGPT 和 GPT-4和5 中使用的以数据为中心的 AI 技术
- CKAN教程之 什么是CKAN?为何全球都用它制作开放数据网站
- 提升SQLite数据插入效率低、速度慢的方法
- Excel VLOOKUP实用教程之 04 vlookup如何实现三变量查找,三个条件字段查询数据?(教程含数据excel)
- 什么是数据可视化
- 《大数据分析原理与实践》一一第1章 绪 论 1.1 什么是大数据
- 赛思互动:大数据能给企业带来什么
- 大数据让景区更智慧
- 大数据时代 还有什么分析不了
- 涉及到数据主权时,云计算用户会担心什么?
- 大数据和云计算两者之间是什么关系呢?
- 浅析进程是什么(代码、数据、pcb)、本地进程通信的4种机制(信号量、管道、消息队列、共享内存)、ipc/rpc/lpc是什么、electron进程通信(ipcMain、ipcRenderer、remote)、nodejs进程通信(child_process、cluster)
- 利用设备上下线状态数据流转到TSDB的方法实现监测设备历史在线情况
- 马拉松大数据营销的真正价值是什么?
- 导入Excel数据到Oracle数据库的脚本
- 无论传入什么数据都转换为列表
- 什么是SQL Server2019大数据群集?
- 雅虎再遇大麻烦 超2亿用户数据泄露