数据是任何机构的核心。它是做出知识渊博、可支持的决策的关键。这些数据的组织方式称为数据架构。
数据架构是一组模型、规则和策略,用于定义如何在数据库中捕获、处理和存储数据。
它还定义了哪些用户可以访问哪些数据以及如何使用这些数据。
如今,许多使用传统数据架构的组织正在重新思考其数据库架构。
这是因为现有的数据架构无法支持当今公司所需的速度、灵活性和容量。
现代数据架构(MDA)解决了这些业务需求,从而使组织能够跨各种存储技术快速查找和统一数据。减少时间、提高灵活性和敏捷性是MDA的主要目标。
现代数据架构通常取决于实现目标。通常,现代数据架构具有以下特征:
- 数据可以从内部系统、基于云的系统以及合作伙伴和第三方提供的任何外部数据中生成。
- 除了批量加载之外,还通过实时数据源收集数据。
- 为数据集市等传统平台以及绘图和映射等专业数据库提供分析。
- 支持从客户到数据科学家的所有类型的用户。
现代数据架构原理
- 将数据作为共享资产查看
- 为用户使用数据提供正确的接口
- 确保安全和访问控制
- 维护通用词汇
- 整理数据
- 消除数据拷贝和移动
现代数据架构的优势
- 采取集中的集成方法
- 从混合环境中删除延迟
- 在你的湖中创建人工智能和分析就绪的数据
- 自动化数据交付和数据仓库和集市的创建
现代数据架构原理
将数据作为共享资产查看
为了使数据在组织中顺畅流动,数据应被视为共享资产。
利益相关者不允许存在跨部门的竖井,而是对公司有一个完整的了解。
这意味着决策者能够透明地了解客户的见解,并能够关联包括制造和物流在内的所有业务职能部门的数据。这导致了效率的提高。
为用户使用数据提供正确的接口
仅将数据存储在一个地方并不能使数据驱动的组织顺利运作。用户应该能够访问数据以从共享数据资产中获益。
需要为用户提供使用数据的接口。
这些界面因用户而异,这取决于用户在生态系统中的位置以及他们需要访问的数据,以高效地完成工作。
确保安全和访问控制
随着大数据和Hadoop为我们提供了一个统一的平台,有必要对原始数据制定和实施数据和访问控制策略。
Apache Sentry等安全项目使这一点变得可行。为此,我们应该寻找能够让我们在不影响对系统控制的情况下构建安全解决方案的技术。
维护通用词汇
在数据中心的帮助下,组织现在能够将数据用作共享资产,并允许同一数据的多个用户访问。
然而,至关重要的是要确保所有访问数据的用户都使用通用词汇表进行分析和理解。
无论用户如何使用数据,产品目录、提供商层次结构、会计日历维度和KPI定义都需要统一。
这对于维护整个组织中数据的完整性至关重要。
整理数据
数据管理包括清理原始数据,建立各种数据集之间的适当关系,以及管理关键维度和度量。
但如果没有适当的管理,用户可能会发现很难在庞大的数据中找到他们需要的数据。这降低了底层数据的感知和实现价值。
通过对数据进行适当的管理和建模,可以充分发挥系统的潜力。
消除数据拷贝和移动
随着数据移动的每一个实例,成本、准确性和时间都会受到影响。最好尽可能减少数据的移动。
大数据和Hadoop的价值主张包括用于并行处理数据集的多结构、多工作负载环境。Hadoop随着数据量的增加而线性扩展。
现代数据架构的优势
过去主导IT基础架构的数据架构不再能够承受当今企业的巨大工作负载。现代建筑有以下各种优点:
采取集中的集成方法
来自大型组织的数据管理起来很复杂。他们经常将来自不同来源的数据输入不同的仓库和数据湖。
整合这些数据可能是一项艰巨的任务。通过集中查看数据,用户可以在整个组织中配置和管理数据。
从混合环境中去除延迟
根据研究,运行数据的价值在大约8小时后下降了大约50%。将数据从一个地方复制到另一个地方会增加过程中的延迟。
库存库存、客户服务改进或整体组织效率等功能的决策需要实时处理。
MDA支持超连接企业。这使得所有能够在尽可能短的时间内访问数据的用户都可以在整个企业中使用数据。
在你的湖中创建人工智能和分析就绪的数据
早期的数据湖计划未能达到最初预期的分析见解。
虽然在湖中收集数据是一项简单的任务,但数据处理是一项具有挑战性的任务。
处理持续更新、合并数据和创建可用于分析的结构是一项艰巨的任务。
MDA不仅将数据放置在它应该放置的位置,而且还根据需要自动创建和更新数据。
有了这一点,数据科学家和分析师可以花更多的时间分析数据,而不是准备数据。
自动化数据交付和数据仓库和集市的创建
一旦数据湖中的数据接收和分析创建实现自动化,下一步将是自动化特定功能仓库和集市的创建。
一旦数据仓库自动化到位,就可以根据需要创建和更新数据集市。这提高了灵活性,降低了项目风险。
成功实现现代数据架构的过程是漫长而复杂的。然而,有了原则和框架,这肯定是可以实现的。
数据无疑是计算的未来,也是企业运作的一种生活方式。因此,至关重要的是,我们要事先掌握数据架构原则,以便有效地管理所有数据。
最新内容
- 3 days ago
- 3 days ago
- 3 days ago
- 5 days 18 hours ago
- 6 days ago
- 6 days ago
- 6 days ago
- 6 days ago
- 1 week 3 days ago
- 1 week 3 days ago