【数据治理】什么是数据域?(包括示例)
视频号
微信公众号
知识星球
确定数据域是数据策略的重要组成部分。那么什么是数据域呢?
它实际上可能意味着几件事,这取决于我们是从数据管理和数据库管理的角度来看,还是从数据治理的角度来看。或者把它看作是从技术或业务的角度来看待它。你可能会说,“乔治,为什么我们两者都关心?让我们只关注数据治理方面”。好吧,我认为你需要意识到这两者。
即使你从事数据治理,你也需要了解技术方面,因为否则,当你与技术数据管理员、数据保管人和IT部门交谈时,他们可能会使用与你不同的术语。即使在与供应商交谈时,我认为理解这两种术语的观点也是很好的。是的,我知道,同一个术语有不同的含义是令人沮丧的,但在数据治理中,这是你会习惯的,因为这是数据治理将试图做的事情之一,澄清这些差异。
数据域(数据库管理)
从数据库管理的角度,或者更好的是,从数据建模的角度来看,数据域表示数据元素可能包含的值的集合。理解这一点的更好方法是通过一个例子。想象一下,我们在填写表格时可能会遇到一个带有下拉字段的在线表格。让我们把它作为性别。
当我们点击该下拉列表时,我们可能会得到一些选项,例如以下选项:
- Male
- Female
- Non-binary
- Not specified
当然,根据你对性别的定义,也可以有其他选择。这不是重点。我们的想法是,我们将有这些固定的选择。当我们将其记录在数据库的表中时,分配给性别的值只能是这4个值中的一个。因此,我们说性别列的数据域是“男性”、“女性”、“非二进制”或“未指定”。
GENDER_TABLE |
---|
MALE |
FEMALE |
NON-BINARY |
NOT SPECIFIED |
数据域(数据治理)
从数据治理的角度来看,数据域意味着其他东西。在这里,数据域是“组织感兴趣的项目或组织内感兴趣的领域的逻辑分组”。
您可以将数据域视为高级数据类别,以便为数据分配责任和责任。顺便说一句,数据域也被称为“主题区域”(subject area)或“数据概念”("data concept"),所以你可能会遇到这两种情况。在数据治理中,它们都指的是同一件事。
请注意,有些是指数据域,其含义与数据集相同。这是不准确的,因为一个数据域可以包含多个数据集,只要这些数据集代表组织内相同的兴趣领域。
如果这仍然像泥一样清晰,让我们看看一些例子。
数据域示例
- Customer
- Product (or Service)
- Location
- Vendor (or Supplier)
- Transaction (or Order, or Sale)
- Legal
一个普通的组织可能有5-10个,但它们并不总是这样,尽管它们通常是最常见的。最终,这真的取决于你所在的行业。
让我们来看一些特定于行业的数据域。
在教育部门,你可能有:
- Student
- Research
- Faculty
- Alumni
- Advancement
在医疗保健行业,您可能有:
- Patient
- Facility
- Medical procedure
在保险行业,您可能会遇到:
- Provider
- Member
在这些扇区中的任何一个扇区中,您也可以拥有以前的一些数据域。例如,我确信所有三个部门都将“位置”、“交易”和“法律”作为数据域。
数据子域
还有数据子域的概念。通常,每个数据域将具有3到10个数据子域之间的任意位置。
什么是子域?这只是一种将数据域进一步划分为其他类别的方法。
不过,也有一些考虑因素:
- 子域是唯一的
- 这些数据域和数据子域之间存在1比1的关系
- 它继承了特性
数据子域示例
让我为您提供上面提到的一些数据域的一些子域示例。
Customer
- Individual
- Corporation
- Government
- Charity
- Group
- Household
Vendor
- Vendor specification
- Pricing
- Service level agreement
Location
- Site
- Geographical area
- Building
- Office
- Warehouse
- Outdoor space
结论
您应该记住的是,这些数据域和子域是对组织中最重要的数据进行分组的一种方式,它们跨越业务单元和系统。因此,对于同一个领域,您可能有来自不同业务线和部门的不同利益相关者,这些数据可以在不同的系统中找到,可以由不同的系统生成,也可以由不同系统使用。
话虽如此,现实也可能有点复杂,当数据不能完美地融入一个或另一个主题领域时,数据可能与多个领域相关联。这不是一种推荐的方法,但有时是不可避免的。
- 417 次浏览