【数据治理】具有这四个重点领域的整体数据治理

视频号

微信公众号

知识星球

Chinese, Simplified

如今,数据的高速率、数量和多样性已使数据治理成为一项业务需求。考虑到内部生成的大量数据以及外部容易获得的数据,现在需要一种严格的方法来管理所有这些信息。

数据治理策略有助于维护数据隐私并满足法规遵从性和法规要求。这种战略包括政策、标准、角色和流程,以确保数据的正确使用、可用性、完整性、可用性和安全性。在分析支持、运营效率和消费者行为方面也有用例,这些用例可以提高运营效率、更好的预测结果、增加最终用户自助服务、增加一致性和成员增长。

illustration of hands working on a computer screen using dials and the screen

拥有多个部门的大型企业往往会看到以不同的方式和格式收集相同的数据。有时,即使是特定捕获数据的值也可能因部门而异。

例如,一个业务函数可能通过不给一个值来将一个项属性为“missing”,而另一个业务功能可能使用特定的值来表示一个项是“missing”。这种数据的不一致性延伸到整个组织,并影响到整个过程和分析——就像使用这些数据创建预测模型时一样。

数据治理确保了跨部门和流程的一致性,并消除了组织的竖井。Thoughtworks Looking Glass 2022讨论了领导者应该如何考虑数据所有权在其组织中的位置,因为数据质量问题往往出现在组织结构和架构中,而这些结构和架构无法激励团队生产和共享他们所拥有的数据资源。

以下是我预计在不久的将来会受到更多关注的一些关键领域:

  • 真相的来源:数据治理旨在理解和简化数据收集和集成的过程,以确定谁拥有数据和真相的来源。它可以被视为主数据管理(MDM)和数据质量管理的一部分。识别和维护数据的真实性来源将保证数据的一致性以及基于所述数据的分析和建模的准确性。然而,尽管这是一个重点领域,但说起来容易做起来难。
  • 人工智能和机器学习中的数据治理:如今,数据和人工智能的大多数领域都需要数据治理。人工智能领域正在迅速发展,基于人工智能的模型的采用也在迅速增加。
    • 虽然人工智能技术可以对社会和经济福利产生广泛而积极的影响,但需要制定立法来保障基本权利,防止用户的安全风险。目前,数据伦理更多是一个组织的“选择性”选择。这意味着,根据对组织的影响以及使其更负责任所需的努力,人工智能解决方案可能会出现一些失误。
    • 数据存在偏见,并导致模型存在偏见。我预计会设计和采用具体的方法和框架来处理这种偏见。可解释的人工智能已经在市场上受到了追捧。我希望更多地关注人工智能和机器学习的可解释性,尤其是在决策可能对人们产生重大影响的情况下——银行和保险业、执法、教育和食品配送等都是如此。
  • 适用于中小型企业:虽然大型企业从对人员/人才的投资中看到了价值,使其拥有与数据治理目标相一致的能力,但中小型企业也将开始从此类投资中看到价值——确保法律合规性,并保持对其产品和服务的信任。
  • 提高整个组织的意识:跨角色和部门对数据治理的全面认识将促进数据质量、完整性和合规性。今年,我预计各组织将进行短期和小额投资,以提高对数据治理的认识。例如,世界银行一直在积极努力提高人们对这一领域的认识。

从数据专业人员到业务领导者,数据治理是每个人的责任。数据治理委员会是一个负责数据质量、数据政策和法规、最佳实践、制定战略和监督数据治理计划、提高组织内部对数据治理的认识等的机构。我相信,只会有更多的“数据治理委员会”出现,寻求多个利益相关者发挥积极作用。

本文地址
https://architect.pub/holistic-data-governance-these-four-focus-areas
SEO Title
Holistic data governance with these four focus areas