【数据架构】数据架构与信息架构:有什么区别?
视频号
微信公众号
知识星球
关于数据架构与信息架构,有一个众所周知的争论。人们经常问的问题是:它们是同一件事吗?
企业架构师、微软博客撰稿人尼克·马利克(Nick Malik)在一个致力于清理维基百科上有关这些主题的条目的小组中认识到了固有的困惑。他的团队认为参赛作品应该合并。然而,在2014年,当他对IT社区进行民意调查时,他很快发现了一个分裂的受众,大约一半的调查参与者认为两者应该保持分离。
让我们来看看数据和信息之间的差异,以及企业组织需要了解的关键注意事项。
数据架构与信息架构
作者同意信息架构和数据架构代表两个截然不同的实体。原因如下所述:
数据与信息的区别
简单地说,数据指的是原始的、无组织的事实。将数据视为在没有上下文的情况下收集和存储的大量条目的捆绑包。一旦上下文通过将两个或多个片段以有意义的方式串在一起而被归因于数据,它就变成了信息。
同样,了解基础设施方面的差异也很重要:
- 信息架构是指为输入、存储和分析有意义的信息而设计的程序的开发。
- 数据架构是解释和存储数据的程序的开发。
架构特色
由于我们已经确定数据和信息是不一样的,因此在其架构平台中不能以相同的方式对待它们是理所当然的。
数据架构是基础。它查看传入的数据,并确定如何捕获、存储数据,以及如何将其集成到其他平台中。一个这样的平台很可能是一个信息架构,比如CRM,它使用原始客户数据来建立关于销售和销售流程的有意义的联系。
CRM是本例中的信息架构,因为它专门处理原始数据并将其转换为有用的数据。
这就是数据架构和信息架构之间的明显区别。数据架构定义了整个组织中数据的收集、存储和移动,而信息架构则将单个数据点解释为有意义的可用信息。
“信息资产”是指已转换为信息的数据的名称。创建信息资产是信息架构的驱动目的。信息资产可以分为以下几类:
- 目录
- 仪表板
- 文件
- 本体论
- 时间表
- 分类学
- 模板
- 术语
每个类别都建议将数据转换为有助于业务计划的内容,无论是类似数据的分组,还是可以向利益相关者提供有意义的数据快照的可视化表示。
数据和信息生命周期管理
另一个区别与生命周期管理角度的需求有关。除了数据和信息之间的明显差异外,每种数据和信息都有其独特的生命周期和在组织内管理它的最佳实践。与数据基础架构是坚实信息基础架构的基础类似,适当的数据生命周期管理将是信息生命周期管理过程的关键驱动因素。
现在,让我们深入了解更多的定义。
数据生命周期管理是指在数据的整个使用寿命中将数据从一个阶段推送到下一个阶段,直到数据最终过时并从数据库中删除的自动化过程。另一方面,信息生命周期管理着眼于一些问题,如一段数据是否有用,如果有用,如何使用?简言之,信息生命周期管理寻求获取原始数据并以相关的方式实施,以形成信息资产。
此外,信息资产有其自身的生命周期和价值,这取决于所涉及数据的质量和有用性以及如上所述的资产类型。信息生命周期过程的一部分要求开发人员考虑未来的状态实现。
例如,建议将一段数据更好地实现为仪表板或文档附件。这可能是提高整个组织的整体知识消耗、使信息民主化或创造更有意义的见解所必需的。
数据驱动的业务模型
越来越多的IT部门正在成为企业商业模式不可或缺的一部分。IT部门辅助流程的日子已经一去不复返了。现在,绝大多数部门和流程都由IT创新提供动力。
剑桥大学的一项研究表明,越来越多的企业正在创建新的模型,以适应对数据和信息的承诺。结果表明,这种方法取得了成效,比竞争对手提高了生产力。
该报告建议,当提出一种新的商业模式时,企业商业领袖会问自己以下问题:
- 数据驱动商业模式的目标结果是什么?
- 我们想为我们的目标市场提供什么?
- 我们需要什么样的软件、硬件和服务才能提供这种型号的产品?
- 我们将在哪里获得这些资源?
- 将如何使用收集的数据?
- 如何将其货币化以支持收入模式?
- 在实现这些目标的过程中,我们将面临哪些挑战?
但是,即使在创建了数据驱动的模型之后,一些公司也会失败,因为他们不理解在整个生命周期和成为信息资产的过程中推动数据的工作流程的重要性。
在数据和信息生命周期中建立最佳实践和工作流程可带来以下好处:
- 提高了整体上市速度
- 极大地降低了所有云环境之间的复杂性
- 易于扩展
- 有助于降低风险
- 改进了集成
为了实现这一点,公司应该研究如何集成、自动化和协调这些工作流程。Control-M等应用程序工作流编排解决方案可帮助组织抽象出众多数据源、多个应用程序和各种基础设施所涉及的复杂性。它帮助组织专注于创建新的信息资产并为业务提供见解,而不是花费宝贵的时间和精力来修复破碎的工作流程。
尽管如此,综合考虑所有因素,企业业务必须有合适的IT员工来创建功能性的业务模型。以下是为信息架构和数据架构创建的员工快照。
员工快照:信息与数据
一个运作良好的企业业务的核心是一个IT部门,该部门拥有合适的人员来管理其信息和数据架构。在下面的文本中,我们将研究数据架构、信息架构或两者都可能需要的位置。
首席信息官
企业组织的首席信息官对技术和创新做出重要决策,是企业商业模式中任何数字化转型或向IT转变的核心。
该职位的一些职责包括创新、集成云环境、激励IT部门以及根据预计需求制定IT预算。首席信息官将对数据和信息架构做出决策。在数据架构方面,一个重要的考虑因素是在数据湖和数据仓库之间做出决定。稍后将详细介绍这些要点。
(将首席信息官与首席技术官进行比较。)
信息架构师
信息架构师是信息架构和自动化生命周期管理过程不可或缺的一部分。他或她将实现信息结构、特性、功能、UI等。信息架构师的主要角色是专注于处理信息资产的基础设施的结构设计和实现。
数据架构师
与信息架构师一样,数据架构师致力于基础设施的结构设计,但在这种情况下,它专门用于收集数据,在生命周期中提取数据,并将其推入其他有意义的系统。
数据分析师
数据分析师的日常工作包括收集、检索和组织来自各种来源的数据,以创建有价值的信息资产。这是一个可能同时在由数据架构和信息架构组成的系统中工作的人。
数据分析师的一些功能越来越自动化,但即使实现了自动化,分析师对创建未来的信息状态仍然很重要。
信息分析员
信息分析师专门从事信息资产的提取和分析。
简要说明:数据湖与数据仓库
数据湖最近越来越受欢迎,但仍与数据仓库混淆。然而,重要的是要认识到这两者有着独特的差异,并且以不同的方式使用。数据仓库是指从组织内的各种来源积累的大量数据存储。
- 仓库用于指导管理决策。
- 数据湖是一个存储库或存储银行,它以原始形式保存大量原始(非结构化)数据,直到需要为止。
(阅读更多关于数据湖和仓库差异的信息。)
最后的思考:数据架构与信息架构
希望到目前为止,信息和数据架构是两个不同的东西的原因已经很清楚了。如果没有,这里简单回顾一下。
数据和信息架构具有明显不同的质量:
- 他们使用不同的资产:数据资产与信息资产
- 它们产生不同的结果
- 它们有着独特的生命周期
- 从架构的角度来看,它们需要不同的东西
- 他们需要具有不同专业的角色才能成为企业组织的一部分
尽管数据和信息架构是独特的,但重要的一点是,它们相互依赖,以便企业组织获得所需的见解,从而做出最明智的业务决策。
- 85 次浏览