zl程序教程

您现在的位置是:首页 >  云平台

当前栏目

DataHub: 现代数据栈的元数据平台--如何使用数据领域Domain?

平台数据领域 如何 -- 现代 domain 使用
2023-09-11 14:16:24 时间

Data Domain 数据域

Data Domain是什么?

DataHub从v0.8.25开始支持针对数据资产进行数据域管理
Data Domain是数据资产的逻辑分组集合,目前一个数据资产一次只能属于一个Data Domain
Data Domain是对数据资产的显式分组、顶级分类。

  • 从数据库管理的角度来看,数据域表示数据元素可能包含的值的集合,如性别列的数据域是“男性”、“女性”、“非二进制”或“未指定”4个值。
  • 从数据治理的角度来看,数据域是“组织感兴趣的项或组织内感兴趣的区域的逻辑分组”。
    • 可以将数据域视为数据的高级类别,目的是为数据分配责任和职责。
    • 在数据治理中,数据领域也称为“主题领域”
    • Data sub-domain 数据子域:通常每个数据域都有3到10个数据子域。

如针对电商的顾客这一数据领域,对应的数据子域:个体、团体、公司、家庭、慈善机构等等

Tags、Glossary Terms、Domains的区别

DataHub支持使用标签、术语表术语、域 来划分不同类型的元数据,以适合特定的目的:

  • Tags 标签: 非正式的,松散的控制标签,作为搜索和发现的工具。资产可能有多个标签。没有正式的集中管理。
  • Glossary Terms 术语表术语: 受控词汇表,具有可选的层次结构。术语通常用于规范叶级属性(即模式字段)的类型。例如(EMAIL_PLAINTEXT)
  • Domains 领域: 一组顶级类别,通常与资产最相关的业务单元/