跳转到主要内容
Chinese, Simplified

您知道数据和算法在您的组织中的使用和处理情况吗?

是还是否?

本页提供了一组21种数据架构概念和原则的信息,您可以使用这些概念和原则来衡量、分析、改进和优化公司中数据的使用和处理方式。

首先,它解释了什么是数据概念和数据原理,使用概念和原理的好处是什么。

接下来提供了一系列概念及其原理。

然后,您可以下载数据架构原理的数据集,将自己的数据添加到其中,并开始衡量数据和算法在您的公司中的使用情况。

数据概念

数据概念是一种处理组织外部已识别或存在的数据的方法,这些数据可以在组织中实现。

数据概念的例子有零信任数据、数据共享和数据验证。

一旦一个概念成为数据架构的一部分,我们就称之为数据架构概念。

组织的“当前状态数据架构”是组织中已实现的一组数据概念。

您有已实现的数据概念的列表吗?

如果您将数据概念作为存储库中的资产进行管理,那么您就可以控制您的数据架构。

数据原则

数据原理是数据概念或数据概念的一部分的工作方式。

一个概念可以有很多原则。

例如,零信任数据原则是:通过在用户通过身份验证之前不允许网络上的用户访问数据,可以确保更少的人可以未经授权访问数据,从而减少数据安全事件的发生。

数据原理告诉您以某种方式使用数据、处理数据、存储和检索数据的效果。

一旦您将数据概念作为数据架构的一部分,该概念的原则就是您组织的数据架构原则。

最重要的是,您所实现的数据架构原则告诉您,您在业务中集成数据和算法的效果如何,并让数据和算法在流程和系统中不间断地流动。

你有一份已实施的数据原则清单吗?

管理原则使您能够控制您的数据架构。

算法

算法是一组强大的指令,用于解决问题或完成任务。

今天,算法有许多发展和改进。

实践表明,你拥有的数据越多,你的算法就越有效,你使用的人工智能/机器语言技术越多,你就越能预测未来。

如今,越来越多的IT系统或应用程序具有嵌入式算法,这些算法工作效率很高,可以优化数据、人工智能和ML的使用,并很好地预测人们的行为。

但权力越大,责任越大。

现在,越来越多的组织需要报告、管理和控制他们使用的算法。

为此,我们还可以了解数据概念和数据原理。

算法可以被视为一个数据概念,用数据做各种事情。因此,通过测量实现的数据算法的类型,可以使公司中的任何算法变得可见和可控。

算法就像微小的CRM/BI程序,用于鉴定和解释数据。因此,它们包含变量、输入、指令、输出、条件、规则和循环,我们可以寻找。

一个需要识别的算法原则是算法数据资格和分类原则:通过确定XXX居住在AAA城市,有工作BBB,教育CCC,并且经常购买DDD,可以确保XXX属于目标受众YYY的类别。

示例公式:YYY=XXX*(AAA和BBB和CCC和DDD)。

具有洞察力和概览

因此,了解哪些数据架构原则在您的组织中得到了实施(以及实施得如何),可以揭示出您可以用来更好地创新和竞争的许多信息。

问题还在于,由于您的战略和业务模型,您需要在哪个成熟度级别实现哪些数据概念和原则。这一切都与未来的状态数据架构有关。

您的数据架构(即概念及其原理)与您的战略和业务模型的一致性越好,您就可以更好地执行您的战略并运行您的业务模型。

使用概念和架构原理的好处

一个概念(实现或方法的抽象)总是有一个或多个原则(概念的工作方式,产生结果)。

科学家每天都在发现和发展新的概念和原理。

它们可以帮助您进行创新和竞争。

了解一个概念的原理,可以帮助你决定你的公司是否需要这个概念,因为它会告诉你产生了哪些结果。

数据架构原则列表

以下数据架构原则可帮助您改进数据架构,从而提高组织的实力。

首先,对概念进行命名,然后阐述概念的第一个原理。在可能的情况下,提供文献参考和(设计)指南。

  概念 原则 参考 指南
1 .数据(资产)管理 通过吸收、存储、组织和维护组织通过文件化和成熟的流程创建和收集的数据,可以确保做出更明智的商业决策,改进营销活动,优化业务运营,降低成本,从而增加收入、利润、存在性和业务连续性。。。    
2 数据验证 通过在输入点验证所有数据,可以确保系统中数据的质量得到提高    
3 数据发现 通过自动化定期数据发现,可以确保组织知道它正在获取多少数据,哪些数据集已对齐,哪些应用程序需要更新    
4 数据共享 通过与其他部门共享数据,可以确保消除组织中的竖井,让更多的人拥有360客户端视图    
5 最佳接口 通过向用户提供正确的接口,确保数据可以轻松共享,并可供他人访问    
6 数据安全和访问控制 通过在原始数据级别制定访问策略和数据访问控制,数据更加安全,访问控制得更好    
7 数据隐私      
8 通用词汇 通过建立一个通用词汇,可以确保实现一致性    
9 数据管理 通过管理数据(如建模正确的数据关系和清理数据),可以确保提高感知和实际数据质量    
10 数据集成 通过以逻辑方式集成数据,可以确保复制的数据更少,以确保数据视图的完整性    
11 数据消除 通过消除数据拷贝和数据移动,可以确保成本更低,数据质量更高,组织更灵活    
12 数据分析/智能      
13 数据算法鉴定和分类      
14 数据预测      
15 数据可视化      
16 数据湖      
17 数据仓库      
18 数据虚拟化      
19 数据中心      
20 数据复杂性      
21 数据事务      
22 零信任 数据通过在数据经过身份验证之前不向网络上的用户提供对数据的访问,可以确保更少的人未经授权访问数据,从而减少数据安全事件的发生    
23 搜索查询日志 记录[通过]让应用程序和数据库始终详细记录用户的搜索查询(最好是通过通用服务),[确保]欺诈和其他恶意活动可以更好、更快地被识别和发现,[从而]提高环境的安全性、可靠性和稳定性,降低风险和成本。(建议的搜索查询日志记录详细信息:日期时间、用户名、用户角色、上下文:进程/任务/应用程序/功能和搜索文本)    
         

 

你对这些数据原理感兴趣吗?想一想!

下载数据集

以上列表作为开放数据架构原则集(JSON格式)提供。

访问数据集页面。

在这里你可以下载数据集

接下来,您可以上传数据,在Dragon1 Viewer中观看。

理解数据共享原则

许多组织希望通过跨部门共享数据来打破各自的竖井。

但在他们决定后的1或2年后,组织中仍然存在许多筒仓。各个部门没有共享有意义的数据,而事实上他们可以共享。

注:在业务中,组织竖井是指独立于其他部门运作且不与其他部门共享数据的部门

假设该组织表示,“来自一个业务部门的数据、元数据、产品和信息,应根据国家或国际管辖法律和政策,包括尊重适当的现有限制,并根据国际道德研究行为标准,与其他业务部门充分公开地共享。”

根据Dragon1方法,这种说法不倾向于被标记为一种原则,而是一种一般规则或指南。这一一般规则或指导方针背后的基本原理通常包含Dragon1所支持的原则。

为什么Dragon1没有将上述声明作为一项原则?

如果我们将数据共享视为一个概念,那么我们可以描述数据共享概念是如何工作和实现结果的。我们可以描述关键要素如何协作并产生结果。

我们可以专注于事情如何运作的始终真实的事情。

当我们偶然发现这些东西时,我们正在描述数据共享的原则。

数据共享的一个原则可以是“通过识别所有可以从任何部门共享并具有明确价值的数据,通过消除共享的所有障碍并通过政策强制共享,确保业务部门之间共享更多数据,并打破竖井。”

上面的描述是一种总是正确的工作方式(或者至少很可能总是正确的)。这是一种工作机制。(当然,这个例子还有待进一步研究。)

一旦我们了解了一个原则(关于世界如何运作),它将影响我们如何设计解决方案、系统和政策。

因此,上述原则产生了影响。

例如,数据共享策略的关键元素经常缺失,或者缺少一个有意义共享的已识别数据列表。如果你实现了关键元素,你就增加了实际共享数据和打破竖井的机会。

如果你喜欢上面的内容,请在你的工作中尝试一下。

如果你不喜欢,就继续使用并依靠你现在的习惯。

要做什么-检查表

以下是一份关于如何最好地利用这些原则的清单:

  1. 对贵公司目前实施的数据概念和数据架构原则进行盘点。
  2. 使用此处提供的原则列表作为参考或起点。
  3. 收集业务流程流程图(BPMN)、数据图(DMN)、应用程序组件图(UML和ArchiMate)以及IT基础架构图(Azure、Amazone、Citrix或IBM模型)正在或应该受到数据架构原则的影响。
  4. 确定流程、数据、应用程序和IT基础架构受到或应该受到这些原则的影响。
  5. 分析差距。
  6. 制定一个路线图来填补这一空白。

测量、可视化和合理化

对于任何组织来说,衡量数据架构原则的实现程度以及成熟度是很重要的。

此外,合理化一个人需要和不需要哪些数据架构原则也是很重要的。

这一点非常重要,因为它让你坐在组织战略的驾驶座上。

在许多组织中,数据很快将成为一个无法控制的复杂整体。

您对数据或其复杂性的控制或管理越好,就越能与之竞争。

开始

Dragon1平台支持上述步骤。

创建一个帐户,并在指导下记录、衡量、合理化和改进您的数据架构原则。

原文地址
https://www.dragon1.com/resources/data-architecture-principles
本文地址
Tags
 
Article

微信

知识星球

微信公众号

视频号