CDGA|数据治理的关键方法是什么?
CDGA|数据治理的关键方法是什么?
数据治理必须涵盖数据的整个生命周期,从数据收集一直到数据管护。在这个生命周期中,数据治理的关键方法一般有7个。
数据模型——做建模
首先,需要由业务人员提出业务需求,并描述业务需求所需的数据内容。其次,通过业务人员及技术人员合作,根据业务对象抽象出数据概念,定义其描述、分类与关系。技术人员根据数据概念描述、分类,抽取出数据实体,并利用ER图描述其关系。
最后,技术人员针对数据库特性将数据实体物化为数据库表,支撑实际应用。
数据质量——做清洗
由于互联网及通信技术的飞速发展以及数据量的爆发式增长,各类数据也大规模增长,可依据相关规范对数据质量即数据的及时性、完整性以及准确性进行限制,详细地通过事前防范、事中监控、事后管控3个时间段进行监督。
数据标准——做统一
根据已确定的企业核心逻辑数据模型,将模型中的数据项抽取出来。然后根据预定的业务数据项筛选方法,筛选出需要进行业务定义的数据项。再根据业务对所筛选出的业务数据项进行分类,产生用于通用数据标准及公共代码定义的数据标准项清单。
而具体的通用数据标准的制定包括定义工作目标、流程、及模版,其分类标准则根据数据在业务中的使用频度和业务需求,参考业界模型,通过汇总分析,对通用数据进行分类,形成统一的数据标准在数据层面的定义,并以数据项自然分类为基础,对数据进行分类。
主数据清理——做编码
主数据是描述核心业务实体的数据,是企业内跨业务重复使用的数据,存在于多个异构的应用系统中,是关键数据,而不是全部数据;是操作性数据,动态参与业务流程,而不是静态数据。
在企业中主数据是全员共享,全员服务的重要数据,与其他数据分离,作为单独的部分进行管理。
数据生命周期——做管理
数据的生命周期包括数据创建、数据使用、数据归档、数据销毁4个阶段。而数据在生命周期内有效则可以满足业务操作和管理分析的需要;满足对历史数据查询相关政策和管理制度的要求;满足审计管理要求;减少数据冗余,提高数据一致性;减少存储、硬件、运维等方面基础设施投入;提升应用系统性能,提高响应速度。因此,数据生命周期的管理必不可少。
数据清理——做规格
数据是数据仓库的灵魂,它不仅提供了数据仓库中数据结构的逻辑层,也提供了数据仓库的构建和使用规则。
为了使数据仓库中各个软件能够无缝地合作,必须在数据层进行有效的集成。所以,研究数据的作用与意义相当重要.数据是关于数据的数据,即是对数据资源的描述,按其描述对象的不同可以分3大类:技术数据、业务数据和管理数据。
数据安全——做防范
数据治理的一个重要作用是保障数据的安全。应该从企业级、体系化视角开展数据安全管理顶层设计。
数据统一分类分级后,通过数据鉴权来控制某一类数据可以被哪些系统调取,可以被哪些人员查看,可以被哪些部门共享,对不符合权限的对象进行限制,有效地防止数据泄露风险。
以上就是数据治理的7大关键方法,数据治理工作的实施落地,另一个方面就是人才,只有更专业的数据治理人才才能面对瞬息万变的时代。
DAMA-CDGA/CDGP数据治理认证
为了解决社会对数据管理人才的紧迫需求,规范化数字要素市场,也为了便于国内广大数据从业者学习相关认证,DAMA中国以国际数据管理协会(简称“DAMA国际”) DAMA数据管理知识体系为基础,结合国内实际需求,对DAMA国际数据管理专业人员认证( CDMP )的考试语言、考试形式、考试内容、证书类型等进行了适当本地化重构。
重构后认证考试分为数据治理工程师( CDGA )和数据治理专家( CDGP ),DAMA中国承担认证考试命题工作,并定期组织中文考试,对考试通过者由DAMA中国颁发认证证书。
证书有效期为三年,获得CDGA认证才能申请CDGP认证考试。
DAMA认证为数据管理专业人士提供职业目标晋升规划,彰显了职业发展里程碑及发展阶梯定义,帮助数据管理从业人士获得企业数字化转型战略下的必备职业能力,促进开展工作实践应用及实际问题解决,形成企业所需的新数字经济下的核心职业竞争能力。
报考要求
CDGA:专科及以上学历获得者;
CDGP:(*先获得CDGA证书才可以报考CDGP)
·博士学位获得者;
·硕士学位获得后,从事IT相关工作1年以上者;
·本科毕业后,从事IT相关工作3年以上者;
·专科毕业后,从事IT相关工作5年以上者。
相关文章
- WinForm TextBox自定义扩展方法数据验证
- Mac OS下安装MongoDB以及配置方法总结【笔记】
- Docker退出容器不关闭容器的方法
- Json字符串转换为java对象的各种实现方法【json_lib框架、Gson、org.json】
- 几种php 删除数组元素方法
- String类常用方法。
- 在Python中使用glob模块查找文件路径的方法
- 数据缺失值的4种处理方法
- 数据分析方法:非正态数据转化成正态数据
- android中实现无标题、全屏的几种方法
- 2021年office2010每次打开都要配置进度解决方法
- 164. 通过 sap.ui.model.odata.v2.ODataModel 的 read 方法,读取 OData 数据的编程方式讲解
- 另一种方法做本地reuse library的开发
- Atitit 非结构化数据管理法 目录 1. 什么是非结构化数据? 1 2. 对非结构化数据也即对全文数据的搜索主要有两种方法: 2 2.1. 顺序扫描法(Serial Scanning): 2 2
- Atitit 软件程序的定义 软件广义定义 程序代码,文档 ,数据 方法,规则, 狭义定义 软件=程序+数据+文档 软件(英文:Software)是一系列按照特定顺序组织的计算机数据和指
- Atitit 知识管理的重要方法 数据来源,聚合,分类,备份,发布 搜索
- ML之FE:在特征工程/数据预处理阶段分离特征与标签/目标变量的三种实现方法之详细攻略
- NLP之TFTS读入数据:TF之TFTS读入时间序列数据的几种方法
- ML之KG:基于自定义电影矩阵+知识图谱矩阵数据集利用基于知识图谱的推荐算法(基于匹配的相似度的方法)实现对用户进行Top电影推荐案例
- Dataset之Pascal:Pascal竞赛及其Pascal VOC(VOC 2012、VOC 2007) 数据集的简介、下载、使用方法详细攻略
- Dataset:heart disease心脏病数据集的简介、下载、使用方法之详细攻略
- Dataset:Medical Data and Hospital Readmissions医疗数据和医院再入院情况数据集的简介、下载、使用方法之详细攻略
- Dataset之Facades:Facades数据集的简介、安装、使用方法之详细攻略
- Qt中几个函数的使用方法
- 4种语义分割数据集Cityscapes上SOTA方法总结
- python 设计模式之模板方法模式
- 小样本学习,阿里做得比较早,但是效果未知——小样本有3类解决方法(算法维度):迁移学习、元学习(模型基础上学习模型)、度量学习(相似度衡量,也就是搜索思路),数据维度还有GAN
- HTTP请求方法之POST请求的三种常见数据提交格式