category
数据很可能是“新石油”,但由于20多年来的松懈治理和数据管理不善,大多数公司现在都存在严重的数据囤积问题。据估计,组织收集和存储的50%至90%的数据都是“暗数据”(一些估计可以在这里和这里找到),即存储但未使用或分析的数据。
换言之,暗数据只是闲置着,收集着虚拟的灰尘,越来越多地存在于主要云服务提供商的庞大存储基础设施中。
猖獗的数据囤积的许多影响都是众所周知的,包括与存储数PB的数据相关的潜在合规性和隐私风险,而你对此一无所知。对于许多公司来说,在确保对其暗数据进行合规管理时,“不问,不说”似乎是一种方法——或者至少,忽视暗数据代表了许多合规官员似乎愿意承担的业务风险。
还经常讨论对存储暗数据成本的其他影响,或通过操作暗数据可以解锁的潜在价值。对于许多CDO来说,存储可能永远不会被使用的大量数据的动机是FOMO的一种形式,在FOMO中,对无法支持未来对新分析见解的请求的恐惧超过了数据存储的成本。
在这种情况下,许多CDO不愿意应用方法来衡量数据的商业价值,这是数据囤积的主要促成因素,“我们有一天可能需要它”的想法足以为云服务提供商带来数百万的年收入。
孤立地说,这种无法(或不愿)将简单的成本/效益分析应用于数据项目的做法对许多公司来说似乎无关紧要,但当在行业层面上大规模应用时,其影响是显而易见的。
数据囤积对环境的负面影响就是这样。数千家公司将其一半以上的数据永久存储在一个虚拟应急基金中,这种累积效应对现实世界的影响超出了数据中心。
根据国际能源协会(IEA)的数据,2020年,数据中心产生了超过300公吨的温室气体。考虑到数据中心的所有能源消耗方面(包括水、电、服务器创建的间接排放等),数据中心行业占全球温室气体排放量的2.5%至3.7%,超过了航空业和全球航运业。
虽然数据中心的很大一部分能源被数字生活中更具交易性的方面所消耗(例如,加密货币挖矿、手机应用程序和在线购买商品,仅举几例),但在全球能源日益稀缺的时候,暗数据甚至存在,这一事实是有问题的。
决定存储越来越多的数据,这些数据永远不会被使用,但会消耗稀缺的能源,这些能源可以用于生产力更高的企业,这应该是公司高管的一个主要担忧。在人工智能日益普及的世界里,情况尤其如此,无休止地囤积数据的动机比以往任何时候都更大。
在一个越来越关注ESG的商业环境中,CDO和其他IT领导者很可能在某个时候会被赋予可持续发展目标,迫使这些高管减少对数据囤积的依赖,并实施流程,以确保所有存储数据的决策都以合理的方式进行,从而为公司和地球带来合理的成本。
在此期间,CDO可以采取四个步骤来开始解决数据囤积问题。
1.重新审视数据治理政策和支持技术
如果您是CDO,并且没有数据发现、保留和归档策略,那么定义这些策略应该是首要任务。这些治理策略应得到数据管理软件的支持,该软件允许您对数据进行编目并自动管理数据的保留/归档过程。这一过程将要求CDO与整个业务的领导者合作,以定义影响所有软件应用程序和系统的策略。
2.开发数据使用分析
一旦可以看到数据庄园中所有资产的位置和属性,数据领导者就必须创建仪表板,以了解这些数据是如何以及是否被实际使用的。从本质上讲,这一过程将帮助数据领导者了解哪些数据是真正的黑暗数据。
3.实施程序以支持所有数据举措的成本/收益
在重新审视数据治理政策的同时,数据领导者还必须重新审视其提供的服务的优先顺序和合理化流程。这意味着数据领导者必须确定他们将如何为所有新的数据计划和维护数据资产所需的所有正在进行的“运营业务”任务提供成本效益分析。
在与主要云服务提供商续签合同期间,是应用这些新开发的数据成本/效益模型的好时机。任何被识别为“暗”的数据都可以采取行动(根据上面步骤1中定义的政策),并且可以以较低的费率续签合同。类似的过程可以随着时间的推移逐步运行到整个企业的所有数据库。
4.解决长期数据文化问题
除了清理暗数据所需的战术步骤外,CDO还必须随着时间的推移努力解决数据囤积的根本原因,包括现有的数据文化,这种文化重视数据囤积,而不是建立对数据商业价值的认识。采用侧重于量化更好的数据管理的好处的流程,再加上应用更好的数据处理流程所实现的成本节约,将大大有助于促进更好的整体数据文化。
最新内容
- 1 week ago
- 1 week ago
- 1 week ago
- 1 week ago
- 1 week ago
- 1 week 6 days ago
- 2 weeks ago
- 2 weeks 2 days ago
- 2 weeks 2 days ago
- 2 weeks 2 days ago