DataHub: 现代数据栈的元数据平台--如何使用数据领域Domain?
2023-09-11 14:16:24 时间
Data Domain 数据域
Data Domain是什么?
DataHub从v0.8.25开始支持针对数据资产进行数据域管理
Data Domain是数据资产的逻辑分组集合,目前一个数据资产一次只能属于一个Data Domain
Data Domain是对数据资产的显式分组、顶级分类。
- 从数据库管理的角度来看,数据域表示数据元素可能包含的值的集合,如性别列的数据域是“男性”、“女性”、“非二进制”或“未指定”4个值。
- 从数据治理的角度来看,数据域是“组织感兴趣的项或组织内感兴趣的区域的逻辑分组”。
- 可以将数据域视为数据的高级类别,目的是为数据分配责任和职责。
- 在数据治理中,数据领域也称为“主题领域”
- Data sub-domain 数据子域:通常每个数据域都有3到10个数据子域。
如针对电商的顾客这一数据领域,对应的数据子域:个体、团体、公司、家庭、慈善机构等等
Tags、Glossary Terms、Domains的区别
DataHub支持使用标签、术语表术语、域 来划分不同类型的元数据,以适合特定的目的:
- Tags 标签: 非正式的,松散的控制标签,作为搜索和发现的工具。资产可能有多个标签。没有正式的集中管理。
- Glossary Terms 术语表术语: 受控词汇表,具有可选的层次结构。术语通常用于规范叶级属性(即模式字段)的类型。例如(EMAIL_PLAINTEXT)
- Domains 领域: 一组顶级类别,通常与资产最相关的业务单元/
相关文章
- [PHP]如何在百度(BAE)和新浪(SAE)的云平台使用PHP连接MySQL并返回结果数据
- 第五十二章 使用 ^SystemPerformance 监视性能 - IBM AIX® 平台的 InterSystems IRIS 性能数据报告
- 第五十一章 使用 ^SystemPerformance 监视性能 - Apple macOS 平台的 InterSystems IRIS 性能数据报告
- 数仓建模—美团数据质量监管平台实践
- 安卓平台上的依赖注入(一)
- DataHub: 现代数据栈的元数据平台--如何与spark集成,自动产生spark作业的数据血缘关系?
- Windows 10 IoT Serials 8 – 如何改变UWP应用的目标平台
- 分享大数据建模工具-大数据挖掘建模平台
- Windows 平台下 pip 下载whl第三方库
- UML建模:基于智慧校园的二手交易平台
- Linux服务器安装zabbix监控平台
- 四川省构建健康大数据平台 2020年实现全省覆盖
- 下一代 iOS 应用的低代码开发平台哪个最厉害,Flutter vs Swift
- Qt编写物联网管理平台45-采集数据转发
- Qt编写物联网管理平台32-表格数据
- 大数据计算平台Spark内核解读
- 厦门自贸片区大数据平台启用
- 国家电网公司大数据平台一期项目通过验收
- SuperMap iObject入门开发系列之一组件式GIS开发平台介绍
- Hadoop平台提供离线数据和Storm平台提供实时数据流
- 高通发布入门级 4G 新平台:专为功能机打造的 205 SoC
- 密云:大数据平台促进休闲农业发展
- 大数据+人工智能:Chinapex发布智能数据平台
- 自动识别验证码实现系统自动登录(可扩展实现无人自动化操作,如领取各个平台的优惠券),不依赖第三方可以支持离线识别处理,附源码可直接运行