跳转到主要内容

数据正在推动全球经济。从初创企业到企业,整个工业部门的组织都希望完善其数据管理模型,标记化是他们的一个重要关注领域。在接下来的研究讨论中,我们将阐述数据标记化的范围和意义,它在现代企业中的作用,以及最终在行业中处于领先地位的关键公司。

标记化定义

标记化是指将高度敏感数据转换为非敏感替代值(称为标记)的过程。令牌不是一个真实的、可利用的值,而只是一个引用,一旦放入令牌化系统进行解码,它就可以连接回机密、敏感数据。

什么是数据标记化(Tokenization)和数据去标记化?

标记化是一种用非关键数据交换关键数据的特定技术。该非敏感数据(称为令牌)没有可解释的值,仅是连接回敏感信息的标识符,因此用户无法访问信息。


标记化的主要目的是保护原始数据不被暴露,并保护其价值。标记化的过程与加密完全不同,在加密中,易受影响的数据被更改和保存,并且在任何情况下都不允许将其用于组织目的。

数据标记化有助于加密数据,从而保持数据安全。例如,客户使用信用卡或借记卡,并打算在网上购物。这个“东西”可以是公司提供的产品或服务。在这里,即使是管理层人员也无法获得信用卡信息,因为信用卡信息以加密代码提供。此外,实时信息和加密信息之间不存在连接。

理解去标记化(De-Tokenization)

这与所谓的标记化正好相反。它需要令牌化发生的原始系统,因为不可能在任何其他桌面或系统上获得确切的数字或令牌。如果要执行一次性在线交易,则无需为未来交易存储数据。相反,如果交易要进行多次,则必须进行加密,以便任何人都无法访问信息。

标记化与加密的比较

符号化

  • 使用替代的随机值
  • 以随机形式在数据库中保存映射
  • 这种方法是不能推翻的
  • 它保护高优先级数据,如卡号等。它保护互联网上的信息。对于卡现付款( card-present payment)至关重要。

加密

  • 将明文转换为密文
  • 扰乱信息,以便政权稍后使用
  • 这种方法是可以推翻的
  • 用于在线和离线商店的存档卡(card on file )和定期付款(recurring payment)方式。

加密改变了整个信息的模式,因此将其更改回来将是一项艰巨的任务,但这也可以在需要时完成。的确,这是一项艰巨的任务,但并非不可能。简单易懂的算法永远无法实现加密,因此需要复杂的算法。

当我们说加密可以在那里逆转时,一个事实是标记化永远不会被推翻。在这种情况下,即使黑客试图入侵信息,他们也永远无法访问信息。这些信息不是以算法的形式,而是将数据转换为无意义的占位符,这些占位符永远无法更改。

如果我们必须强调标记化和加密之间的一些差异,那么我们需要标记以下几点:-

  • 标记化将数据转换为一些随机代码,不可能反转,而加密可以由专家反转。
  • 卡号、安全号等是令牌化的实例。另一方面,文件和电子邮件被加密。
  • 通过电话支付(Payments over the phone)或亲自进行的交易是加密数据的示例,如果我们看到令牌化的用例,则它们是文件卡支付、定期支付和在不同位置存储客户数据。
  • 令牌化中的安全数据保留在锁和加密中,关键数据进入加密算法。对于高安全性,数据标记化是最好的,但如果可能出现任何解密的可能性,则可以使用加密,这里要提到的是,即使加密破坏也不是一个简单的过程。

企业家的PCI范围可以减少PCI PA DSS的业务范围。如果我们讨论一个公共元素,那么这两个元素都消除了供应商的PCI PA DSS范围。

令牌化情况下的数据可以很容易地使用,保存在“令牌库”中,并进行加密,该库被锁定,必要时可以解密。在易于猜测实际值的情况下,标记化可能是一个糟糕的选择,这就是为什么需要使用这两种方法的专家知识。从而可以容易地作出审慎的决定。

 

市场规模、增长和趋势

标记化统计

  • 统计                                         值
  • 当前市场规模(2022年):   25亿美元
  • 2026年的市场规模(预计):56亿美元
  • 数据泄露的平均成本:           424万美元
  • 年增长率   :                          19%
  • 2030年(预计)市场规模:92亿美元+

数据符号化与市场统计

 

根据《市场与市场报告》,全球市场已从2021的23亿美元飙升至2026年的56亿美元,复合年增长率为19%。

有几个因素将以猖獗的速度提高代币化的效果和传播,如下所示:

因素1:成本效益高的云的兴起

基于云的令牌化是一种将敏感数据交换为称为令牌的不可逆、非敏感占位符,并将原始敏感数据安全存储在组织内部系统之外的方法。

它可以比传统的本地令牌化更便宜,更易于集成。它还通过从数据环境中删除敏感数据,进一步降低了组织的风险和合规范围。

此外,通过使用格式和/或长度保留标记作为原始敏感数据的占位符,企业可以在不牺牲其实用性或当前业务流程灵活性的情况下保护数据。

因素2:非接触式支付的兴起

关键因素是现在需要非接触式支付。由于新冠疫情,人们希望交换流动性货币而不是货币。

该方法还消除了对实际存储过程的要求。不需要保存信用卡和借记卡信息,这种流动资金可以帮助很多。

需要非接触式支付,以拯救人类免受新冠肺炎等流行病的传播。

有趣的事实:根据研究与市场,BFSI拥有巨大的市场份额,未来几年甚至会如此。在垂直交易中,有各种各样的交易,它们引诱网络罪犯。BFSI交易对于罪犯来说是一个迷人的地方。根据预测,基于API的段有助于生成不可逆的代码。它揭示了对标记化的日益增长的需求。

因素3:数据泄露的增加

犯罪分子以接受信用卡和借记卡的企业为目标,因为支付信息中有丰富的情报。标记化有助于保护企业免受数据盗窃的负面财务影响。即使在发生漏洞的情况下,有价值的个人数据也根本无法窃取。

信用卡代币化有助于在线企业提高数据安全性,从数据捕获到存储,因为它消除了POS机和内部系统中信用卡号的实际存储。

欺诈活动和数据泄露正在吸引每个组织的注意。将数据暴露给黑客的风险与日俱增,因此需要采用适当的防止数据的方法进行检查。增加数据泄露的风险可以促进代币化市场。

IBM最近的一份报告发现,在同一时间段内,数据泄露的平均成本上升了10%,从386万美元上升到424万美元。有趣的是,远程工作和疫情带来的数字化转型使数据泄露的总成本平均增加了107万美元。

使用数据产品实现标记化

以前,数据标记化解决方案将业务合作伙伴数据存储在集中数据库中。这样一个共同的失败点是一个巨大的风险。正如已经详细讨论的,Web 3.0,分散数据存储时代确保了数据产品计划的更大范围,该计划将加密和标记化数据集分发到数百万个微数据库中。领先的数据管理结构K2View已成功实施了该方法。Fabric为每个业务合作伙伴专用一个微数据库,从而降低违规风险,同时确保合规性

此外,K2View数据产品为多个操作用例实时标记数据。这也适用于批量分析工作负载。不容错过的是,它们保留了格式,并在整个数据环境中保持了数据的完整性。实时

用例和限制

4数据标记化用例

如上所述,在标记化系统之外,标记化不能逆转为其原始形式。这确保了数据机密性的端到端保护,从而跨流程驱动多个用例。最常见的用例是支付代币化,它推动了web 3.0各种应用程序的数字资产交易,例如与区块链相关的应用程序。其他包括:

1) 历史数据的符号化

在许多公司中,数据是存储的,这些数据没有用处,但可能会被误用。历史数据,如姓氏、信用卡信息和与个人医疗保健相关的价值等,因此如果要进行分析,那么也可以在没有此类信息的情况下进行分析。算法可以用来表示特定的数据,这是最简单和最安全的方法。

2) 开发和QA环境中的标记化

标记化是一种为软件开发人员和测试人员提供数据格式和连续性所需信息的方法。有趣的是,实际数据并没有公开,因为它是以隐藏形式提供的。

真实值永远不可见,因为它们在被传输到系统之前被代币替代,并且关联也得到了很好的维护。而在加密中,数据的维度保持原样。

通过这种软件开发和质量保证数据,您消除了这些系统的损坏风险,并消除了数据丢失和质量保证团队对数据丢失的怀疑。

标记化有助于分析增长和质量保证环境的一致数据。风险在于披露客户相关数据,因为公司无法显示实际价值。IT部门可以开发一种方法来象征性地显示数据,以保持机密性。

3) BI的标记化

商业智能和查询,即BI,是在很大程度上使用标记化的重要场所。IT部门提供一些隐藏的报告,并为用户的利益创建这些报告,用户可以根据这些报告分析当前的趋势,如果以简单的形式给出,则可以增加责任和任务,从而使IT部门更负责任,只是数据不能直接公开,只有获得相关信息。

总体而言,代币化的好处是不可估量的,并将在多个组织中谨慎和广泛地使用,以保护用户的隐私,这些用户显示了对商业组织的信任,毫无疑问,未来是绿色的。

4) 简化数据仓库和湖泊的法规遵从性

在传统方法中,集中式数据仓库(如仓库和湖泊)接收和存储来自多个源的数据,这些数据可以是结构化和非结构化格式。这使得按照法规遵从性规范实施数据保护变得复杂。标记化解决了这个问题。它使您能够将原始PII与湖泊和仓库分开。这有助于降低违反任何合规准则的风险。

数据标记化限制

作为一种安全协议,它使数据管理基础设施复杂化。此外,它仍然只有数量有限的支付处理程序支持,因此您可能不得不使用可能不是您首选的支付处理工具。

使用标记化的数据需要从远程服务中对其进行去标记和检索。这会给流程带来事务时间的少量增加,在大多数情况下可以忽略不计。

此外,采用标记化并不意味着支付网关完全没有风险,特别是当第三方必须访问信息时。

在这种情况下,组织必须监控第三方在其端部具有完全安全的系统。使用标记化信息需要对其进行去标记化并从远程服务中恢复。事务时间延迟并产生问题。

简而言之,

  • 可能无法处理大型组织使用的所有数据;
  • 可能不适用于应用程序和处理技术。

因此,您必须权衡您的选择,并与正确的数据产品平台协作。此时,您应该围绕关键空白构建清晰性,以填充数据景观。

顶级标记化平台

顶级数据标记化产品公司

鉴于对高级数据标记化的需求快速增长,服务提供商数量大幅增加。除IBM等高端IT巨头外,我们发现以下三家公司正在通过其创新方法增加价值。它们中的每一个都填补了现有数据架构中的空白。还有更多。

1) K2View

K2VIEW因其独特的数据结构和标记化架构而广受欢迎。结构首次成功实现了微数据库的概念。在这里,基础设施将业务合作伙伴数据存储在一个小型数据库中。这些微数据库中的每一个都只保存特定业务合作伙伴的数据,而fabric维护着数百万个数据。

数据管理产品提供了广泛的其他服务,如网格、数据编排、集成等。该公司采用数据产品方法,提供最安全、可扩展和运营效率最高的数据标记化解决方案。该系统工作在一个中央机制上,用于操作和分析工作负载的标记化和去标记化。

2) TokenEx

ToeknEX为客户提供企业级令牌化服务,并在访问、存储和保护数据的方式上提供无限的数字灵活性。他们的团队与各种数据处理渠道和最新技术无缝协作,帮助您提供资产标记化服务。它致力于将代币化标准化,作为监管和行业合规的一种手段。它们因服务于BFSI行业而受欢迎,尤其是在支付网关/集成模块上工作的产品。

3) Imperva

Imperva是一家数据管理咨询公司,提供一系列用于屏蔽原始数据的加密技术的产品/服务。该公司的代币化服务非常专注于跨本地系统、云系统或混合环境的端到端数据安全。Imperva以其网络安全服务而闻名,使各组织能够透明地查看其通过垂直渠道访问、持有、使用和传输的数据。

本文:

知识星球
 
微信公众号
 
视频号