【ODPi 】数据治理

视频号

微信公众号

知识星球

Chinese, Simplified

尽管ODPi Egeria支持所有类型的治理,但它特别关注数据治理,因为(1)数据对现代数字业务至关重要,(2)数据本质上需要特殊处理。

与椅子或建筑物等物理对象不同,数据可以通过多种方式自由复制和组合。它是流动的。这就是为什么在描述数据管理时,水的类比(如数据湖)很受欢迎。

数据的流动性带来了两个挑战:

  • 不同数据资产之间的分界线是什么?
  • 当有这么多副本时,谁负责数据的质量和保护?

此外,数据的原始含义经常丢失。数据是在特定上下文中创建的(例如应用程序或特定传感器)。这种背景意味着对数据的准确性、质量、及时性和完整性做出了某些假设

当数据被复制并发送到不同的目的地时,需要捕获此上下文,以便可以使用它来验证数据是否可以在新的上下文中使用

一些标准数据格式,如JPG和MP3文件,包括对这种上下文的支持,这种上下文被称为元数据(字面上是关于数据的数据)。但是,大多数数据的格式不包括此元数据,必须单独管理

下一个挑战是,人们通常对他们使用的术语的确切含义很草率,这种缺乏准确性的情况可能会导致对特定数据值的含义的误解。即使在同一组织中,一个术语也可能有多种含义,或者它们可能是同一事物的多个术语。为了将数据的含义从一个上下文传达到另一个上下文,需要协调用于描述数据的术语含义中的这些异常。

最后,数据所有权仍然存在很多不确定性。仅仅因为一个组织持有数据,并不意味着它有权处理这些数据。这些数据可能受到版权的约束(如知识共享许可证,或更特定类型的数据许可证(如社区数据许可协议(CDLA)),也可能是受特定数据隐私法规约束的个人数据(如通用数据保护条例(GDPR))。

这意味着组织需要跟踪数据存储和应用程序之间的数据流,以确保其仅用于批准的目的。组织需要定义持有数据副本的人员的确切职责以及他们必须满足的要求。

本文地址
https://architect.pub/odpi-governance-data
SEO Title
ODPi Governance of data