企业数据治理框架与元素
一、数据治理的目标:
1.数据有明确和准确的定义
数据必须有明确和准确的定义与说明。此定义包含业务定义和技术定义。
2.数据有明确的责任方
数据用户对数据有明确的责任,数据的责任包括以下三种:数据拥有者、数据管理者、数据使用者。数据用户的不同责任对应数据治理的不同职能。
3.数据内容符合标准要求
数据要符合我行制订的数据标准化的规则和要求。
4.数据内容符合质量要求
数据要满足数据用户对数据的质量要求。
5.数据的成本与价值可计量
数据是银行的重要资产,数据的成本和业务价值必须是可计量的。建立可计量的数据成本和数据价值模型是数据治理工作的重要前提条件。
6.数据集中存储与管理
避免数据的复制与分散,减少数据冗余,提高数据的集中度。建立数据集中管理的组织与机制。从根本上减少数据治理的难度与复杂度。
7.数据存储有合理的期限和方式
数据必须有明确的存储期限,并根据数据的价值和访问情况,在数据生命周期的不同阶段,采取不同的存储方式。
8.数据进行统一的加工和整合
数据需要采用统一的加工和整合规则进行处理,采用统一的加工工具和手段,以达到数据的标准和质量要求。
9.数据是易访问的
数据在满足标准、质量、安全的前提下,可以让数据用户尽可能方便的访问到。
10.数据访问有安全控制
数据用户对数据的访问必须有安全控制,数据访问的安全控制是可靠的、一致的。
二、数据治理的体系结构
企业级数据治理体系架构为企业交付整合的,可信任的和安全的信息。
基于企业愿景和规划,以及数据治理目标和原则,数据治理体系框架包含了6个关键的数据管理要素,管理把数据转变为整合的、可信任的和安全的信息,围绕着六个关键的数据管理要素,数据治理和数据认责层用于管理这些数据管理要素,在治理和管理数据中,将涉及人员,流程和技术。数据治理定义中的关键词解释如下:
•数据治理
数据治理体系是为数据管理制订方向和优先级,提供资金和资源,制订政策、原则和管理办法,解决冲突的过程,以确保提供集成的、可信的数据。
•数据认责
数据认责专题是指数据治理中的角色,他们确保数据管理过程和数据治理相关活动符合数据治理部门制订的政策、原则和制度。
•组织
数据治理组织包括数据治理相关部门、角色和职责。
•制度
数据治理制度是数据治理的政策、管理办法和操作手册的总称。
•流程
数据治理流程是治理角色执行治理政策的规范化的过程,包括IT基础、服务水平协议等手段。
•技术
数据治理技术是通过信息化手段实现治理治理角色与流程的集成。
三、集成的数据管理关键要素
数据治理6个关键的数据管理要素如下图所示:
1、数据质量管理
数据质量专题是指确定数据质量改善的重点、范围和价值评估,确定数据质量的角色与职责,建立质量决策权力。制订企业级数据质量的政策、标准和原则。分析数据问题、查找根本原因、提供数据质量状态报告。
数据质量的目标就是确保数据适合于它的预期用途,上图显示了数据质量提升步骤。
•第一步–问题选择/定义
在这一步,数据被从技术和业务两个方面进行定义。技术术语举例有:数据类型、长度、或小数位数,业务术语举例有:风险等级的不同形式。这个定义步骤捕获任何数据必须满足的规则。这些规则按照公共的质量标准/尺度联系起来:正确性、完全性、时效性、唯一性、连续性和参照完整性等。
数据治理/数据认责应用:数据治理委员会决定数据质量提升的重点、范围和资金。数据治理小组建立SLA和目标,建立流程和工具。
•第二步–数据剖析
第一步描述的定义和规则将导致数据质量评估计划的建立,来验证那些定义和规则的正确性。同样地,这个计划将详细描述数据必须满足的适合它预期用途的属性,即:它定义了数据质量。这个计划将指导初始的数据度量,通常也称为数据剖析。
数据治理/数据认责应用:数据治理小组定义数据分类和标准,SME提供业务解释。
•第三步-影响分析&共性分析
假定数据质量评估计划没有描述数据错误带来的影响,影响分析需要处理一个给定的错误在预期的数据使用适合性方面会带来的影响。
所谓共性分析就是分析错误具有的共性,我们期望许多错误都可以归结到某类共同的原因。这个分析是为下一步追踪根本原因作准备。
数据治理/数据认责应用:数据管理员分析数据剖析结果,SME提供业务含义。
•第四步-追踪根本原因
鱼骨图是一个众所周知的用于鉴别数据质量背后根本原因的工具。它反应了需要达到的和实际的数据质量之间的差距原因通常是:信息、流程、技术,和/或人员。
数据治理/数据认责应用:数据管理员决定根本原因,SME提供业务和技术解释。
•第五步-预防/修复数据质量问题
追踪数据质量问题的根本原因后,可以选择不同的方式来预防和修复数据质量问题,每一个选择都有相关的优点和弱点,也受到需要修复的数据量大小的影响。
数据治理/数据认责应用:数据管理员推荐修复方案,数据治理小组批准,SME进行修复。
•第六步-趋势监控
人们通常相信一旦一个修复被确定和应用后,这个特定的问题将被永远解决了。然而,这是通常的情况,但是当牵涉到人员和流程时,事情往往没有那么简单。不断地与存储的质量监控数据做比较,或许应用统计流程管理措施是明智的做法。
数据治理/数据认责应用:数据管理员监控数据质量并提供状态报告,倡导质量提升。
2、数据整合
数据整合专题是指确立企业SOA架构,制订企业级数据抽取、加载、转换方案,明确数据整合职责和权力,定义一致的数据加工和处理规范,推动跨部门的整合一体化。
数据治理/数据认责应用于数据整合:
•数据治理提供了在整个企业内的数据整合所需要的目标和基础设施。
•数据治理负责高效的整合(如:SOA),使数据能够以通用形式(结构和模式)进行共享。
•数据治理建立标准的DI流程和工具。
数据治理定义的DI架构政策和标准。
•数据管理员维护的业务规则适用于在其特定的数据域整合数据,确保一致的
数据定义。
•数据管理员确保DI架构政策和标准适用于指定的主题域。
•数据管理员带来跨职能整合的挑战。
3、数据安全&隐私
数据安全专题是指定义企业信息安全和信息保密的原则和规则,确定数据安全的职责和权力;实施安全管理,审核需求、架构符合安全规范,数据脱敏和删除规则,安全风险评估和安全事件管理。
•安全
保护数据资产和处理方法的准确性和完整性。
确保关键业务信息的保护。
确保只有经过授权的访问。
•隐私
确保个人信息的数据资产,只有那些被授权的人访问。
数据治理/数据认责应用于数据安全&隐私:
•指定隐私合规部门/人员
•开发和执行正式的隐私政策
•关于客户和业务合作伙伴数据的保密政策在任何时候都要遵守
•个人隐私在所有应用开发计划(操作型和分析型)中都要被考虑
•企业要通过安全/保密标准(ISO2700x,etc.)
•通过一个独立的外部审计、测试和验证流程定期评估安全性
•客户/业务合作伙伴能够访问可适用的法规,隐私政策,私密性设定,以及可应用的数据
4、元数据管理
元数据管理专题是指确定企业级元数据管理的重点、范围和框架,确定元数据的角色与职责,决策权力和问责机制,确保元数据定义的一致性,确保元数据的流程和工作应用与整个企业。
元数据对于业务用户:
•是一个组织内部可用的信息目录。
•是一个业务术语目录(定义,公式)。
•是业务规则的集合。
•是一个数据资料库(跟踪数据从产生到使用)。
元数据对于IT:
•是一个可重用的关于数据的目录。
•变更数据结构或流程时,用于影响分析。
•是业务使用数据的一个记录。
因此需要确保元数据是容易访问的,并且是一致的,当前的,准确的,有实效性的,和完整的。
数据治理/数据认责应用于元数据管理:
•业务,技术,与操作元数据从所有源和目标系统中获取在一个中心资料库中维护近实时地更新
•捕获和/或验证业务元数据是数据管理员的责任
•元数据是任何数据和应用的一部分
•用户能够提取元数据
•用户能够通过对资料库中元数据的观察提供见解和经验
5、数据标准/主数据
数据标准专题是指根据数据标准的业务价值评估,发起数据标准的规则制订,并确保数据标准的规则在标准管理的制度下得到实施和验证。分析、解决和评审数据标准相关问题。而主数据管理是在数据仓库中解决数据不一致和部门间冲突最常见的情形。伴随企业的发展,不同系统间会产生重叠的数据,如:
•客户,供应商,产品
•机构,渠道,地点,人员
数据的不一致意味着对参考数据和主数据具有不同的识别和分类方法,很难实现单一的业务视图,即使所有的数据都已经加载到数据仓库。
•根本原因:没有集中的数据治理不同的系统/应用对同一个客户具有不同的数据集合。
数据治理/数据认责应用于数据标准/主数据管理:
•对于数据治理和数据管理职责,需要建立一个公共的数据整合架构、策略和原则
•定义企业范围可共享的流程和数据政策
•可选择的ETL,EAI,和复制技术或工具
•错误修正和时间计划
•及时的数据交付
6、数据架构/数据模型管理
逻辑和物理数据模型设计需要理解业务信息需求,并且要考虑有效的数据库使用。数据治理的目标就是治理一致的和非冗余的数据定义和数据结构。
数据治理/数据认责应用于数据架构/数据模型管理:
•有一个专注于企业数据建模的核心小组。
协调整个企业不同主题域数据模型
•映射关系将在逻辑和物理模型间进行维护。
•数据模型应该是丰富的。
具有清晰的业务定义
•逻辑模型将用于物理开发时的设计约束条件。由一个模型小组进行维护是物理实施时一个正确的反映。
•模型建立的过程是所有新开发的项目中一个主要的部分。
•存在数据模型标准,并且需要遵循。
四、数据治理架构的实施
如何把治理的概念应用到处理数据管理不善的问题?执行好的数据治理架构需要基于3个主要元素:
•组织:谁来做决策?需要建立怎样的结构化组织,谁将参加这些组织,以及他们的角色和职责是什么?
•流程:如何作数据决策?计划建立或扩展的数据资产、审核和批准数据相关的投资、以及投资优先级的决策流程是什么?
•技术:这些流程和决策的结果如何被审核、监控、度量和传达?将采用什么机制向利益相关者传达数据投资决策?
围绕着数据管理流程,通过建立一个有效的数据治理组织,对数据以及数据管理的方式进行监督。这样,就能够直接控制数据管理的投资,并且确保他们与企业目标相一致,并产生期望的商业价值。
数据认责将确保数据治理创建的数据政策,标准,指导原则和规则被真正地应用,数据在定义和使用上保持一致性。数据认责确保数据管理者在负责的数据领域执行数据管理流程。
数据治理和数据认责都需要确保数据管理流程能够有效地执行(交付安全的、整合的和可信任的信息),并且使用最小的成本和最低的风险,因此,数据资产无形中就转换成商业利益-从数据中获得最优的价值。
数据治理架构实施的前提是必须对以下几个方面具有深刻的认识和理解:
•理解数据治理的目标
•理解数据治理成熟度评估模型和等级
•懂得组织结构的问题如何影响数据治理
•认识到数据认责对数据治理的作用
将要开发或开展数据管治理架构流程的组织,通常都先进行一个数据治理成熟度评估。理解当前组织内部的数据治理状态,对于规划数据治理策略是及其有帮助的。数据治理成熟度模型由六个阶段构成。
•阶段0-流程不存在(根本没有可应用的管理流程,没有专职的数据治理团队)
•阶段1-初步的/临时的流程(流程是临时的、无组织的,有兼职的数据治理人员)
•阶段2-重复的、按部就班的流程(跟随一种经常化的流程模式,无积极性,建立专职的数据治理团队)
•阶段3-定义了流程(流程被定义并且有文档证明,逐步建立数据治理技术平台)
•阶段4-可管理和度量的流程(流程被监控和度量,数据治理技术平台逐步完善)
•阶段5-最优化的流程(被遵循和自动化的最佳实践)
本文为作者授权发布,不代表移动支付网立场,转载请注明作者及来源,未按照规范转载者,移动支付网保留追究相应责任的权利。