【数据治理】在ChatGPT时代,治理是一个更热门的话题,也是解决数据质量问题的12个步骤。
视频号
微信公众号
知识星球
我对Gartner®2023年数据与分析峰会的印象和展望-第2部分。
本博客系列的内容:
- 有目的的领导。与信任建立联系。产生影响。
- 在ChatGPT时代,治理是一个更热门的话题,也是解决数据质量问题的12个步骤。
- 数据湖/网格/数据结构和介于两者之间的一切(活动元数据)。
- 数据业务的未来。
在本系列博客的第一部分,我指出了信任峰会中反复出现的主题,以及它如何与决策和合作联系在一起。正如我在前一篇博客中所述,在像ChatGPT这样的生成人工智能工具时代,信任更为重要。我们如何增加和促进对组织和组织之间的信任?没错,治理!
如果你想向Gartner了解数据和分析领域的治理趋势,Saul Judah就是你想见到的人。我相信他是该领域的顶尖专家之一。很自然,Saul的会议“数据和分析治理:基础与前景”[1]在我参加峰会的名单上名列前茅。
他在开场白中承认,治理仍然是研发计划的头号成功推动者
(Diagram: Data and Analytics Governance: Foundations and Prospects, Saul Judah, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
这可能是因为政策是行为变革的推动者,很明显,我们需要改变行为:尽管73%的组织报告对治理举措给予了高度支持和投资,但成功仍然有限,主要是在合规方面。根据“现代数据和分析治理的七个必须具备的基础”,控制(或出于自身原因坚持合规)的治理成熟度得分低于2.1,而具有结果适度、灵活性和自主治理的控制,成熟度指数得分高于3.5。根据扫罗·犹大的说法,这就是我们需要的治理。
我们如何定义我们需要的治理,驱动所需行为的类型?Saul将数据和分析治理定义为“决策权和问责制框架的规范,以确保在数据和分析的估值、创建、消费和控制方面的适当行为。”
因此,我们如何定义成功?是信任吗?还是协作?KPI金字塔详细介绍了从数据质量到效率再到战略确认的结果,向我们展示了不同利益相关者的不同成功标准:
(Diagram: Data and Analytics Governance: Foundations and Prospects, Saul Judah, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
如果所有这些角色都在您的治理委员会中,它们可以将决策推进到流程和业务环境中。考虑一个“数据办公室”,它协调并促进管理委员会、业务治理委员会和各种流程所有者之间对所有治理举措的支持。
成功治理过程的另一个方面是了解数据和分析资产的性质:在考虑每种类型资产的重要性和敏感性水平后,定义其可接受的信任水平。对于一些组织来说,他们的CRM数据集不如用于人工智能模型的数据集安全,这是可以接受的,对于其他组织来说,CRM安全是他们的最高优先级。
(Diagram: Data and Analytics Governance: Foundations and Prospects, Saul Judah, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
除了考虑资产来源,我们如何定义可接受的信任水平?机会与风险偏好!如果两者都很高,风险是可以接受的;如果两者都很低,最好避免风险;在其他情况下,最好减轻或转移风险。
选择首批治理利益相关者和治理委员会成员的最佳人选是早期采用者。他们可以接受教育,从狂热者那里,他们可以成为治理的催化剂和大使,因为我们希望从控制转向合作,从官僚主义转向鼓励创新,从“勉强度日”转向“完成任务”。
最后,以下是我们需要回答的D&A治理问题:
- 我们需要知道吗?(监控和自助服务)
- 它安全吗?(访问和安全)
- 它值得信赖吗?(评分、认证、数据质量、元数据)
- 这能被利用吗?(可重用性和可访问性)
一旦我们了解了D&A治理的含义以及它是如何实施和衡量的,我们就可以看到它在整个D&A战略和运营模式的全球层面上的位置(“DAOM”,Gartner门户网站上有很多关于这个主题的资源)。治理属于生态系统的一部分。它是战略和运营之间的粘合剂,是目标与正确执行之间的粘合剂。没有治理,我们就无法实现战略。
(Diagram: Data and Analytics Governance: Foundations and Prospects, Saul Judah, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
我对Saul关于D&A治理成功的建议的看法如下:
- 结合Gartner的“IT研发得分”和上述七个基本步骤来评估您当前的治理实践。
- 了解组织的短期和长期业务战略,并绘制研发技术和趋势图,这些战略可以从中受益。
- 确定支持这些计划所需的治理功能,并选择支持您需求的技术平台。
- 招募早期采用者,并将他们变成大使和催化剂。
将Saul的会议与Thornton Craig的“有效部署数据和分析治理以推动更好的决策”结合起来是非常合适的[2]。本次会议展望了治理的业务用例实施,以及治理为组织内不同角色提供的决策过程。
总而言之,实施治理的有效方法是什么?尝试-上下文!
(Diagram: Deploy Data and Analytics Governance Effectively to Drive Better Decisions, Thornton Craig, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
为了有效,D&A治理的所有四大支柱都必须与业务价值相联系,并得到足够的技术自动化支持。技术工具应支持识别、管理、工作流程、协调和可视化等活动。
还记得Saul会议上的KPI金字塔吗?对于Thornton Craig来说,治理是自上而下的灰色箭头,通过运营目标从战略到战术:
(Diagram: Deploy Data and Analytics Governance Effectively to Drive Better Decisions, Thornton Craig, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
如果您考虑启动治理项目,请根据战略/人员/指标/流程/基础设施标准,回答尽可能多的关于您的倡议的问题:
- 它是否与组织的业务战略一致?
- 你们有治理委员会吗?分配的数据管理员?批准的资金?
- 您是否确定了可衡量的目标和指标?
- 你在改变现有的做事方式吗?
- 什么是现有的和/或新的技术,可以帮助您促进和自动化大多数预期任务?
一旦你回答了这些问题,下一步就是正确识别相关的技术能力:
(Diagram: Deploy Data and Analytics Governance Effectively to Drive Better Decisions, Thornton Craig, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
投资新技术的决策应该由驱动因素和政策驱动,然后转化为工具能力。为了避免孤立,请使用上下文工具来互连驱动程序和策略。
然后问问自己,你已经为自动化程度做好了准备。你要找的是扩充目录吗?管理定义冲突的术语表?要理解用法的分类法?或者管理人员和治理委员会可以使用以上所有内容?它是一个活跃的元数据工具,可以为您移动指针吗?
在了解了如何高效地建立D&A治理流程之后,让我们探讨它如何支持组织决策流程。
知情决策应基于角色和工具功能:
(Diagram: Deploy Data and Analytics Governance Effectively to Drive Better Decisions, Thornton Craig, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
角色从CDO到数据工程师,决策从风险分析到数据分析。无论底层技术是什么,都要将上述五项活动(识别、管理、工作流应用、协调和可视化)与相关功能结合起来,再加上您现有的功能。
如果你觉得上面的学科对你来说太先进了,并且仍然专注于数据质量,那么应该解决这个问题。数据质量是任何D&A计划的首要前提,因此,Melody Chien在“提高和维持数据质量的十二项行动”[3]会议上提出了一些实用的建议,这真是太棒了。
Melody分享了一个关于数据质量差的影响的令人震惊的统计数据。
(Diagram: Twelve Actions to Improve and Sustain Your Data Quality, Melody Chien, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
需要注意的是,这并不一定意味着糟糕的数据质量总是如此昂贵。然而,肯定大多数公司都能找到自己令人震惊的例子。
Melody建议在四个步骤中采取十二项行动来提高数据质量(DQ):从哪里开始,谁负责,做什么,以及如何使其变得更好:
(Diagram: Twelve Actions to Improve and Sustain Your Data Quality, Melody Chien, Gartner Data & Analytics Summit, Orlando, Florida, 20–22 March, 2023.)
数据质量是每个人的工作,因此随后,它不再是任何人的责任。为了解决这个问题,选择你的冠军,理想情况下,如果你有资源,一次开始所有四个步骤的十二个动作:
- 确定业务用例(并非所有数据都同等重要)-受(较差)数据质量影响的主要业务结果是什么?
- 从IT部门找到利益相关者,同时也要深入业务职能部门。教他们DQ的通用语言。
- 确定最关键的DQ问题:通常是在法规遵从性方面。为您的用例定义什么是“足够好的”,定期重新检查,并分析错误容忍度。
- DQ应该是治理倡议的一部分,永远不要单独处理。不仅要与治理委员会对话,还要与其业务利益相关者进行对话。
- 技能:聘请精通沟通和项目管理、政治头脑强、具有商业头脑、数据和分析技能的数据管理员。他们会调查问题,有时甚至会解决问题;策划和管理元数据;定义和监控规则;并协调DQ最佳实践。
- DQ对业务和IT的兴趣是一项团队运动。从最能受益的个人开始,向他们展示成功故事,以及利益集团领导人,激发激情。
- 数据分析和监控:找到一个工具来量化你的DQ。监测异常情况和基准品位。
- 制定一个改进计划,包括短期分析、预防计划和补救任务。
- 从基于真相的模型切换到基于信任的模型。打破信任介绍级别(有保证的、肯定的、证明的、承认的、断言的、未知的)。为每个数据资产定义所需的级别,并确定改进的优先级。这是索尔演讲的一部分(如上所述)。
- 利用自动化和扩充:否则就不可能进行扩展。使用AI/ML的活动元数据是需要查找的工具。
- 将DQ纳入业务工作流程。分析DQ问题发生的频率,并通过集中的DQ服务交付解决这些问题。
- 数据素养:接受DQ思维,让人们关心,并促进知识转移。
我们正处于世代人工智能时代的边缘,ChatGPT在微软强大的品牌支持下率先发展。在将这些先进的Generative AI工具应用于您的数据环境之前,必须解决数据质量和治理问题。否则,我们最终会得到一个更昂贵的“垃圾进垃圾出”版本。但这还不够:你还需要控制Generative AI工具如何将其数据模型解释(或映射)到你自己的数据模型-如果这种映射做得不正确,例如,供应商帐户被错误地映射到客户帐户,即使数据质量最好,我们也会得到错误的结果。因此,治理不仅不会很快取得进展,而且在不久的将来将成为不可或缺的工具。然而,它必须经过高度的自动化才能有效地应对这些新的挑战。自动化或至少增强治理是可能的,其中一种方法是激活元数据。我将在本系列的后面讨论这个问题。
在博客的第一部分,我介绍了企业战略和运营计划的重大转变。在这篇博客中,我调查了治理如何使企业在控制质量的同时实现技术突破。在下一篇博客中,我将深入研究数据环境,或者“数据网格与数据结构”
- [1] Gartner,“数据与分析治理:基础与前景”,Gartner数据与分析峰会,佛罗里达州奥兰多,2023年3月20日至22日。
- [2] Gartner,“有效部署数据和分析治理以推动更好的决策”,Gartner数据和分析峰会,佛罗里达州奥兰多,2023年3月20日至22日。
- [3] Gartner,“提高和维持数据质量的十二项行动”,Gartner数据与分析峰会,佛罗里达州奥兰多,2023年3月20日至22日。
*GARTNER是GARTNER,Inc.和/或其附属公司在美国和国际上的注册商标和服务商标,在获得许可的情况下使用。保留所有权利。
- 46 次浏览