Datahub新版本0.9.1更新,列级别数据血缘功能发布!
大家好,我是独孤风。
近期Datahub进行了一次大的版本更新,从0.9版本以后Datahub也正式发布了列级别数据血缘的功能。
0.9.1版本又增加了,列的影响分析这个功能。
这样Datahub对于列级别数据血缘的功能支撑就非常完善了。
目前Datahub支持列级别数据血缘的主要功能有。
1、建立列级别数据血缘的API 2、Snowflake和Looker,Tableau的列级别数据血缘实现 3、列级别数据血缘的可视化 4、列的影响分析
列级别的数据血缘非常的重要。主要是从“来”和“去”两个方向对于数据血缘进行分析。
1、理解列如何计算产生的。
该列是否由敏感数据计算产生。 计算该列数据都进行了什么运算?
2、理解该列如何被使用 可否弃用该列,而不影响后续的指标计算。 该列用于了哪张图表?
与Atlas的展示不同,Datahub将列血缘和数据集血缘放在了一起展示,对于数据脉络的理解也更加的清晰。
另外Datahub也发布了未来一段时间的开发计划表,值得关注的有: 2022年四季度 ,实现Bigquery和Redshift 的列级别数据血缘。 2023年一季度,实现对Spark的支持。
这也让我们对Datahub的未来有了更多的期待,赶紧升级用起来吧!
另外,在这几年的写作中,我也发现了除了文字以外,用视频的方式来表达可能会更加的清晰,生动,效率更高。所以我也在近期开通了大数据流动的视频号。以后也会在视频号中做一些教程,功能展示,部署演示等等作品出来。
这次的Datahub列级别数据血缘,我也做了一个简洁的视频进行介绍,不过视频制作我还是小白,也是第一次尝试配音。有不足之处还希望大家多多谅解,我会不断的改进。
也希望大家多多关注,转发。这是我坚持下去的唯一动力!
大数据流动视频号作品 《Datahub列级别数据血缘演示说明》
相关文章
- Tapdata Cloud 版本上新!率先支持数据校验、类型映射等6大新功能
- 大数据必知必会之Kafka
- layui实现数据分页功能_layui分页使用
- (四)定义响应式数据的第二种方法
- Hbase(三) hbase协处理器与二级索引详解大数据
- 利用Oracle大数据进行安全的备份存储(oracle大数据备份)
- 解决Oracle数据导入速度慢的方法(oracle数据导入慢)
- MySQL视图技术:实现数据查询功能(mysql视图创建)
- PHP操作MySQL数据库,实现强大的数据功能(php调用mysql数据库)
- MySQL中的二进制数据存储方式(mysql二进制数据)
- Mongodb C语言实现自增功能:简单高效的数据自增方式(mongodbc自增)
- 功能利用Oracle自动排序功能实现数据快速排序(oracle自动排序)
- 25个字的文章标题:Redis开启高效数据存储和缓存功能(开启redis)
- 存储数据外的运用SQL Server的潜能:除了数据存储,还有哪些可能?(sqlserver除了)
- Mysql数据库恢复:从备份还原数据的方法(mysql数据库还原命令)
- 数据SQL Server支持数据过滤功能(sqlserver 过滤)
- MySQL序列号:赋予数据记录唯一性的秘密武器(mysql的序列号)
- MSSQL触发器实现数据统计功能(mssql 触发器 统计)
- 高效实现MySQL排名功能,快速查询数据,提升性能(mysql中做排名)
- 深入理解Oracle元数据维护(oracle元数据维护)
- SSM框架中使用Redis轻松实现高效数据存储(ssm中redis搭建)
- 比较ES和Redis的数据写入功能(写入es和写入redis)
- 遇上数据瓶颈,你还敢不建索引揭秘MySQL不建索引的25个坏处(mysql不建索引坏处)
- Redis突破性新功能赋予数据价值(redis 赋值)
- JQuery简便实现页面元素数据验证功能
- SQLServer使用Merge语句当源表数据集为空时,无法进行查询的问题