【数据架构】什么是数据架构?概述和最佳实践

视频号

微信公众号

知识星球

Chinese, Simplified

目录

  • 什么是数据架构?
  • 数据架构原理
  • 数据架构框架
  • 数据架构图工具
  • 什么是数据架构师?

什么是数据架构?数据架构原理数据架构框架数据架构图工具什么是数据架构师?查看更多

在当今数据驱动的市场中,数据是领先竞争对手的关键。世界各地的公司都在利用其日益快速增长的数据量来做出战略商业决策。但是,由于数据无处不在,业务领导者必须能够筛选非结构化且往往不稳定的数据,并使其可行,以便解决复杂的业务问题。这使得数据架构变得更加重要。数据架构描述了如何在信息系统中收集、存储和使用数据。

什么是数据架构?

数据架构是有效数据策略的基础。根据数据架构的定义,它是一个由模型、策略、规则和标准组成的框架,组织用来管理数据及其在组织中的流动。在公司内部,每个人都希望数据易于访问、清理良好并定期更新。成功的数据架构标准化了捕获、存储、转换可用数据并将其交付给需要的人的流程。它确定了将使用数据的业务用户及其不同的需求。

数据架构的一个好方法是使其从数据消费者流向数据源,而不是相反。目标是将业务需求转换为数据和系统需求。公司需要有一个集中的数据架构,该架构与业务流程保持一致,并提供数据各个方面的清晰性。数据架构的各个组成部分是结果、活动和行为。

数据架构是数据架构师的职权范围。数据架构师构建、优化和维护概念和逻辑数据库模型。他们决定如何获取能够推动业务发展的数据,以及如何分发这些数据,为决策者提供有价值的见解。

数据架构原理

数据架构原则包括与数据收集、使用、管理和集成相关的一组规则。这些原则构成了数据架构框架的基础,有助于建立有效的数据策略和数据驱动决策。

在入口点验证所有数据

通过消除坏数据和常见数据错误来改善组织数据的整体健康状况非常重要。设计数据架构以尽快标记和更正错误。数据集成平台可以帮助做到这一点——在进入点自动验证数据。这也将有助于最大限度地减少清理和准备数据所需的时间。

努力保持一致性

为数据架构使用通用词汇将帮助同一项目中的用户进行协作。无论应用程序或业务功能如何,共享数据资产(如产品目录、会计日历维度等)都必须使用通用词汇表。此类共享数据的用户必须根据相同的核心定义工作,以保持对数据架构和数据治理的控制。

一切都应该记录下来

养成记录数据流程所有部分的习惯,以便数据可见性和数据在整个组织中保持标准化。文档应帮助您记录收集的数据量、对齐的数据集以及需要更新的应用程序。一致的文档应与数据集成无缝配合。

避免数据重复和移动

每次移动数据都会影响成本、准确性和时间。现代数据架构应该减少对额外数据移动的需求,以降低成本、提高数据新鲜度并优化数据灵活性。现代数据架构将数据视为共享资产,不允许部门数据孤岛。这使得普遍更新数据变得更简单,并且每个人都可以从单一版本的数据进行操作。

用户需要充分访问数据

数据架构书籍规定,必须为用户提供正确的接口,以便使用指定的工具使用数据。

安全和访问控制至关重要

数据安全项目的出现使得确保统一的数据安全变得更加容易。数据架构必须在不影响对原始数据的访问控制的情况下进行安全设计。

数据架构框架

有多个企业架构框架用作构建组织的数据架构框架的基础。

  • DAMA-DMBOK 2 

这是指DAMA International的数据管理知识体系——一个专门为数据管理设计的框架。它包括数据管理术语、功能、可交付成果、角色的标准定义,还介绍了数据管理原则的指导方针。

  • 企业架构的Zachman框架

20世纪80年代,John Zachman在IBM创建了这个企业本体论。该框架的“数据”列包括多层,如业务的关键架构标准、语义模型或概念/企业数据模型、企业或逻辑数据模型、物理数据模型和实际数据库。

  • 开放式组架构框架(TOGAF)

TOGAF是最常用的企业架构方法论,它为设计、规划、实现和管理数据架构最佳实践提供了一个框架。它有助于定义业务目标并使其与架构目标保持一致。

数据架构图工具

正确和一致的数据流对于成功的数据架构至关重要。为了获得最佳结果,需要定义和结构化数据流和数据关系。这就是数据架构图的用武之地。数据架构图展示了数据如何以及在哪里流动、处理和利用。数据架构图可以帮助决定如何更新和优化数据存储资源。由于数据是不断收集和使用的,因此您需要经常修改和更新数据架构图。

数据架构图应包含以下详细信息:

  • 说明数据处理是如何进行的
  • 显示数据的存储方式和位置
  • 显示数据增量的估计速率
  • 签署有助于未来增长的组件

专业软件或基于云的智能绘图应用程序可用于高科技数据架构图。用于创建和共享架构模型的著名数据架构工具包括:

  • Diagrams.net
  • Lucidchart
  • Gliffy
  • ER/Studio

什么是数据架构师?

数据架构师是将业务需求转化为技术需求并定义数据标准和原则的数据管理专业人员。数据架构师的角色是业务和技术之间的关键纽带;因此,合格的数据架构师受到招聘公司的高度追捧。

数据架构师做什么?

作为数据架构背后的主谋,数据架构师为数据流和数据管理创建蓝图。他们评估组织的潜在数据源,并制定计划来集中、集成、保护和维持这些数据源。因此,员工可以随时随地访问关键信息。

数据架构师的角色需要:

  • 与IT团队合作制定数据战略
  • 建立实施架构所需的数据清单
  • 研究数据获取机会
  • 识别和评估正在使用的数据管理技术
  • 开发数据模型等。

如何成为一名数据架构师?

由于数据架构师是一个不断发展的工作角色,因此没有关于如何成为数据架构师的具体培训或认证课程。通常,数据工程师、数据科学家或解决方案架构师等专业人员专门从事数据设计和数据管理;他们在职业道路上努力成为数据架构师。

高技能的数据科学专业人员在全球就业市场上需求量很大。各行各业的公司都在招聘能够跨越商业和IT领域的数据架构师。

如果你想在数据科学或数据架构领域建立自己的职业生涯,或者觉得有必要提高自己的技能,可以考虑由Simplilearn提供的加州理工学院数据科学研究生课程,Simplilearn是世界领先的在线认证培训提供商之一。

本文地址
https://architect.pub
SEO Title
What Is Data Architecture? Overview and Best Practices