跳转到主要内容

热门内容

今日:

  • 【业务架构】波特的五力分析教程
  • [Power BI]Power BI安全白皮书
  • 用户研究
  • 【营销】2022 终极指南: 如何编写和格式化白皮书
  • 数字化运营
  • 【开源合规】使用MySQL许可:开源许可与商业许可
  • 【数字化运营】什么是KPI?根据关键业务目标衡量您的绩效(第一部)
  • 【企业安全架构】EA874:安全架构团队
  • 数据战略
  • 【工业物联网】工控协议解析:DNP3协议简单介绍及协议识别方法

总体:

  • 【数据集成】用于数据集成的10个最佳开源ETL工具
  • 【Java框架】2022 年 17 个流行的 Java 框架:优缺点等
  • 【管理】热尔韦原理综述
  • 【开源许可】从开源到免费和开源,MinIO现在在GNU AGPLv3许可
  • 【SAP】如何开始使用Sap AFS和Sap FMS。
  • 【数据目录】OpenMetadata与DataHub:比较架构、功能、集成等
  • 【数据治理】开源数据治理-2023年需要考虑的7个最佳工具
  • 【开源合规】使用MySQL许可:开源许可与商业许可
  • 【微服务架构】微服务已死——迷你服务万岁
  • 【SAP GUI】什么是SAP GUI(图形用户界面)以及如何使用它

最近浏览:

  • 【数据管道】在数据管道中使用dbt和Duckdb而不是Spark
  • 【数据治理框架】数据治理框架-示例、模板、标准、最佳实践&如何创建数据治理框架?
  • 【SAP GUI】什么是SAP GUI(图形用户界面)以及如何使用它
  • 数据沿袭
  • [Power Apps]模型驱动应用程序中表单填写的副驾驶辅助
  • 数据战略
  • 使用LangChain代理构建数学应用程序
  • [Microsoft Copilot Studio]Copilot 连接器、操作和扩展概述(预览)
  • 【Microsoft Copilot】为Microsoft 365扩展Microsoft Copilot
  • [Microsoft Search] Microsoft搜索概述

热门内容

今日:

  • 【联轴器】机械:联轴器类型
  • 【开源合规】使用MySQL许可:开源许可与商业许可
  • 【数据编制架构】什么是数据编织(Data fabric)? 完整指南
  • 【信息架构】UX 信息架构初学者指南
  • 【用户体验】用户研究基础
  • 【业务架构】波特的五力分析教程
  • 用户研究
  • 「存储」硬盘与SSD:存储的未来是什么?-第2部分(数据中心)
  • 【供应链】什么是供应链控制塔?
  • 【前端架构】React vs Vue -选择正确框架的CTOs指南

总体:

  • 语言和框架
  • 【容器架构】Minikube vs.kind vs.k3s-我应该用哪一个?
  • 【数据集成】用于数据集成的10个最佳开源ETL工具
  • 【Java框架】2022 年 17 个流行的 Java 框架:优缺点等
  • 【技术选型】Keras、TensorFlow和PyTorch的区别
  • 【深度学习】45测试深度学习基础知识的数据科学家的问题(以及解决方案)
  • 【数据架构】什么是实体关系图(ERD)?
  • 【Rust架构】Rust web框架比较
  • 【知识】DIKW(数据,信息,知识,智慧)金字塔
  • 【技术选型】AMQP vs MQTT

最近浏览:

  • 【数据管道】在数据管道中使用dbt和Duckdb而不是Spark
  • 【创新和组织】苹果如何组织创新
  • 【安全运营】完美结合:漏洞评估和渗透测试(VAPT)
  • 【数据编制架构】什么是数据编织(Data fabric)? 完整指南
  • 【数据治理框架】数据治理框架-示例、模板、标准、最佳实践&如何创建数据治理框架?
  • 【SAP GUI】什么是SAP GUI(图形用户界面)以及如何使用它
  • 「微服务架构」分散您的微服务组织
  • 数据沿袭
  • 【供应链】什么是供应链控制塔?
  • [Power Apps]模型驱动应用程序中表单填写的副驾驶辅助

首页
x

Main navigation

  • 主页
  • 数字化 +
    • 数字业务自动化
    • 数字化方案
    • 数字化转型战略
    • 数字化转型治理
    • 数字化运营
    • 数字化客户
      • 客户
    • 数字化研发
      • 研发
    • 数字化制造
    • 数字化生产
    • 数字化供应链
    • 数字化销售
    • 数字化服务
    • 数字化营销
      • 营销
    • 数字化财务
    • 人力资源
    • 数字化法务
  • 企业架构 +
    • 企业安全架构
    • 企业架构框架
    • 方案架构
  • 企业业务架构
  • 企业技术架构
  • 企业应用架构
  • 企业数据架构
  • 数据应用架构 +
    • 主数据架构
    • 大数据架构
    • 数据仓库架构
    • 数据保护
    • 数据库架构
    • 数据建模
    • 数据枢纽架构
    • 数据湖架构
    • 数据编制架构
    • 数据网格架构
    • 数据虚拟化架构
  • 集成架构 +
  • 架构质量 +
  • 软件架构 +
  • 大数据架构 +
    • Hadoop 生态
    • Saprk生态
    • 大数据战略
  • 数据和分析 +
    • 机器学习
    • 数据分析
    • 数据可视化
    • 数据工程
    • 数据战略
    • 数据挖掘
    • 数据科学
    • 商务智能
  • 数据库架构 +
    • MySql架构
    • PostgreSql架构
    • 云数据库
    • 内存数据库
    • 列式数据库
    • 图形数据库
    • 搜索引擎
    • 文档数据库
  • 数据治理
  • 数据管理 +
    • 数据仓库
    • 数据湖
  • 企业合规管理
  • 企业治理 +
  • 企业风险管理
  • 隐私保护
  • 智能转型 +
  • 云计算 +
    • AWS 平台
    • SaaS云
    • Salesforce
    • 云原生
    • 云架构
    • 云治理
    • 云转型战略
    • 容器云
    • 微软云
    • 私有云
  • 人工智能 +
  • 生成式人工智能 +
    • 多模态模型
    • 大视觉模型
    • 大语言模型
    • 大音频模型
  • 万物互联 +
    • 工业控制系统
    • 工业物联网
    • 物联网(IoT)安全
    • 物联网(IoT)架构
    • 物联网战略
    • 边缘计算
  • 元宇宙
  • 区块链 +
  • 安全 +
    • 云安全
    • 安全工具
    • 安全战略
    • 安全运营
    • 应用安全
    • 数据安全
    • 终端安全
    • 网络安全
    • 隐私保护
  • 基础设施 +
  • 软件开发 +
    • 开发管理
    • 需求分析
    • 低代码开发
  • 软件测试 +
  • 软件设计
  • DevOps +
  • 敏捷
  • 项目 +
  • 平台和工具 +
    • DevOps工具
    • 云计算平台
    • 企业事件枢纽
    • 其他工具
    • 分布式平台
    • 大数据平台
    • 应用中间件
    • 开发工具
    • 数据工具
    • 集成平台
  • 语言和框架 +
    • Go语言
    • Javascript开发
    • Java开发
    • Python开发
    • Rust语言
    • TypeScript开发
    • 前端技术和框架
    • 算法和数据结构
  • 硬件和设备 +
  • 产品 +
    • 产品管理
    • 产品设计
  • 技术 +
    • 技术趋势
    • 技术选型
  • 用户体验 +
  • IT管理 +
  • 商业 +
    • 商业模型
    • 商业管理
    • 商业结构
    • 商业计划
    • 商务沟通
    • 创业
      • 创业管理
    • 国际商务
    • 经济
  • 战略 +
  • 管理 +
  • 解决方案
  • 关注
  • 社区
  • 职业
  • 职业和职位 +
  • 咨询服务
  • 微软专栏

【Azure云】Azure上受监管数据的安全研究环境

  1. 首页 ⟶
  2. 【Azure云】Azure上受监管数据的安全研究环境
Chinese, Simplified
SEO Title
Secure research environment for regulated data on Azure

category

  • 云计算

该架构展示了一个安全的研究环境,旨在允许研究人员在更高级别的控制和数据保护下访问敏感数据。本文适用于受法规遵从性或其他严格安全要求约束的组织。

架构


安全研究环境示意图。

Download a Visio file of this architecture.

数据流

  1. 数据所有者将数据集上载到公共blob存储帐户中。数据使用Microsoft托管密钥进行加密。
  2. Azure数据工厂使用一个触发器,该触发器开始将上载的数据集复制到另一个具有安全控制的存储帐户上的特定位置(导入路径)。只能通过专用终结点访问存储帐户。此外,它由权限有限的服务主体访问。数据工厂删除原始副本,使数据集不可变。
  3. 研究人员使用Azure虚拟桌面作为特权跳转框,通过流媒体应用程序访问安全环境。
  4. 安全存储帐户中的数据集被提供给在安全网络环境中提供的数据科学虚拟机,用于研究工作。大部分数据准备都是在这些虚拟机上完成的。
  5. 该安全环境具有Azure机器学习计算,可以通过Azure机器学习功能的用户专用端点访问数据集,例如训练、部署、自动化和管理机器学习模型。在这一点上,创建的模型符合监管指南。通过删除个人信息来取消对所有模型数据的识别。
  6. 模型或取消标识的数据将保存到安全存储(导出路径)上的单独位置。当新数据添加到导出路径时,会触发一个逻辑应用程序。在这种体系结构中,逻辑应用程序处于安全环境之外,因为没有数据发送到逻辑应用程序。它的唯一功能是发送通知并启动手动审批流程。
  7. 该应用程序启动审批流程,请求对排队导出的数据进行审查。手动审核人员确保不会导出敏感数据。在审查过程之后,数据要么被批准,要么被拒绝。

     

    1. 笔记
      如果exfiltering不需要审批步骤,则可以省略逻辑应用程序步骤。

     

  8. 如果取消标识的数据得到批准,它将被发送到数据工厂实例。
  9. 数据工厂将数据移动到一个单独容器中的公共存储帐户,以允许外部研究人员访问他们导出的数据和模型。或者,您可以在安全性较低的环境中配置另一个存储帐户。

组件


该体系结构由几个Azure服务组成,这些服务根据需要扩展资源。服务及其作用如下所述。有关开始使用这些服务的产品文档的链接,请参阅下一步。

核心工作负载组件


以下是移动和处理研究数据的核心组件。

  1. Azure数据科学虚拟机(DSVM):配置有用于数据分析和机器学习的工具的虚拟机。
  2. Azure机器学习:用于训练、部署、自动化和管理机器学习模型,并管理机器学习计算资源的分配和使用。
  3. Azure机器学习计算:用于训练和测试机器学习和人工智能模型的节点集群。计算是根据自动缩放选项按需分配的。
  4. Azure Blob存储:有两个实例。公共实例用于临时存储数据所有者上传的数据。此外,它还将建模后的未识别数据存储在一个单独的容器中。第二个实例是私有的。它从机器学习中接收训练脚本所使用的训练和测试数据集。存储作为虚拟驱动器安装到机器学习计算集群的每个节点上。
  5. Azure数据工厂:自动在不同安全级别的存储帐户之间移动数据,以确保职责分离。
  6. Azure虚拟桌面用作跳转框,可根据需要通过流式应用程序和完整的桌面访问安全环境中的资源。或者,你可以使用Azure堡垒。但是,要清楚地了解两种选择之间的安全控制差异。虚拟桌面有一些优点:
  7. 能够流式传输像Microsoft Visual Studio Code这样的应用程序,以在机器学习计算资源上运行笔记本电脑。
    能够限制复制、粘贴和屏幕捕获。
    支持对DSVM的Microsoft Entra身份验证。
    Azure Logic Apps提供自动化的低代码工作流,用于开发手动审批流程的触发和发布部分。

 

姿势管理组件


这些组件持续监控工作负载及其环境的态势。其目的是在发现风险后立即发现并减轻风险。

  1. Microsoft Defender for Cloud用于评估实施的总体安全态势,并为法规遵从性提供证明机制。以前在审计或评估过程中发现的问题可以尽早发现。使用安全分数和合规分数等功能来跟踪进度。
  2. Microsoft Sentinel是安全信息和事件管理(SIEM)以及安全协调、自动化和响应(SOAR)解决方案。您可以集中查看来自各种来源的日志和警报,并利用先进的人工智能和安全分析来检测、搜寻、预防和应对威胁。
  3. Azure Monitor可在整个环境中提供可观测性。查看大多数Azure资源中的指标、活动日志和诊断日志,无需添加配置。管理工具,如Microsoft Defender for Cloud中的管理工具,也会将日志数据推送到Azure Monitor。

 

治理组件

  • Azure策略有助于强制执行组织标准并大规模评估合规性。
     

选择

  1. 该解决方案使用数据工厂将数据移动到单独容器中的公共存储帐户,以便外部研究人员能够访问其导出的数据和模型。或者,您可以在安全性较低的环境中配置另一个存储帐户。
  2. 此解决方案使用Azure虚拟桌面作为跳转框,通过流式应用程序和完整的桌面访问安全环境中的资源。或者,你可以使用Azure堡垒。但是,虚拟桌面有一些优势,包括流式传输应用程序的能力,限制复制/粘贴和屏幕捕获,以及支持AAC身份验证。您也可以考虑在本地配置点对点VPN进行离线培训。这也将有助于节省工作站使用多个虚拟机的成本。
  3. 为了确保数据的安全,此解决方案使用强大的加密技术,使用Microsoft托管密钥对所有Azure存储进行加密。或者,您可以使用客户管理的密钥。密钥必须存储在托管密钥存储中。
     

场景详细信息


潜在用例


该体系结构最初是为具有《健康保险便携性和责任法案》(HIPAA)要求的高等教育研究机构创建的。然而,这种设计可以用于任何需要隔离数据以进行研究的行业。一些例子包括:

  • 根据美国国家标准与技术研究所(NIST)要求处理监管数据的行业
  • 与内部或外部研究人员合作的医疗中心
  • 银行和金融


通过遵循指导,您可以保持对研究数据的完全控制,职责分离,并满足严格的监管合规标准,同时在以研究为导向的工作量中提供典型角色之间的协作;数据所有者、研究人员和审批者。

注意事项


这些注意事项实现了Azure架构良好的框架的支柱,这是一套可用于提高工作负载质量的指导原则。有关详细信息,请参阅Microsoft Azure架构良好的框架。

安全


安全性提供了防止蓄意攻击和滥用您的宝贵数据和系统的保证。有关更多信息,请参阅安全支柱概述。

该架构的主要目标是提供一个安全可信的研究环境,严格限制数据从安全区域的泄露。

网络安全


用于存储、测试和训练研究数据集的Azure资源是在安全的环境中提供的。该环境是一个Azure虚拟网络,具有网络安全组(NSG)规则来限制访问,主要包括:

  • 对公共互联网和虚拟网络内的入站和出站访问。
  • 进出特定服务和端口。例如,此体系结构会阻止除Azure服务(如Azure Monitor)所需端口之外的所有端口范围。服务标签和相应服务的完整列表可以在虚拟网络服务标签中找到。

此外,接受在仅限于批准的访问方法的端口上使用Azure虚拟桌面(AVD)从虚拟网络进行访问,拒绝所有其他流量。与此环境相比,其他虚拟网络(具有AVD)相对开放。

安全环境中的主要blob存储不在公共互联网上。它只能通过专用端点连接和Azure存储防火墙在虚拟网络中访问。它用于限制客户端可以连接到Azure文件共享的网络。

此体系结构对安全环境中的主数据存储使用基于凭据的身份验证。在这种情况下,像订阅ID和令牌授权这样的连接信息存储在密钥库中。另一种选择是创建基于身份的数据访问,使用您的Azure帐户来确认您是否有权访问存储服务。在基于身份的数据访问场景中,不会保存任何身份验证凭据。有关如何使用基于身份的数据访问的详细信息,请参阅使用基于身份数据访问连接到存储。

计算集群可以通过使用Azure Private Link生态系统和服务/专用端点,而不是使用公共IP进行通信,仅在虚拟网络内进行通信。请确保启用“无公共IP”。有关该功能的详细信息,目前正在预览中(截至2022年3月7日),请参阅计算实例无公共IP。

安全环境使用Azure机器学习计算通过专用端点访问数据集。此外,Azure防火墙可用于控制来自Azure机器学习计算的出站访问。要了解如何配置Azure防火墙以控制对驻留在机器学习工作区中的Azure机器学习计算的访问,请参阅配置入站和出站网络流量。

要了解保护Azure机器学习环境的方法之一,请参阅博客文章“安全Azure机器学习服务(AMLS)环境”。

对于无法使用专用端点有效配置的Azure服务,或无法提供有状态数据包检查的服务,请考虑使用Azure防火墙或第三方网络虚拟设备(NVA)。

身份管理


Blob存储访问是通过Azure基于角色的访问控制(RBAC)进行的。

Azure虚拟桌面支持对DSVM的Microsoft Entra身份验证。

数据工厂使用托管标识访问blob存储中的数据。DSVM还将托管标识用于修复任务。

数据安全


为了确保数据的安全,所有Azure存储都使用Microsoft托管密钥加密,并使用强加密技术。

或者,您可以使用客户管理的密钥。密钥必须存储在托管密钥存储中。在此架构中,Azure密钥库部署在安全环境中,用于存储加密密钥和证书等机密。安全虚拟网络中的资源通过专用端点访问密钥库。

治理注意事项


使Azure策略能够强制执行标准并提供自动补救,以使资源符合特定策略的要求。这些策略可以作为单个策略或作为监管举措的一部分应用于项目订阅或管理组级别。

例如,在此体系结构中,Azure Policy Guest Configuration应用于范围中的所有VM。该策略可以审核数据科学虚拟机的操作系统和机器配置。

VM映像


Data Science虚拟机运行自定义的基本映像。要构建基本映像,我们强烈推荐Azure image Builder等技术。通过这种方式,您可以创建一个可重复的映像,该映像可以在需要时进行部署。

基本映像可能需要更新,例如其他二进制文件。这些二进制文件应该上传到公共blob存储,并在安全环境中流动,就像数据集由数据所有者上传一样。

其他注意事项


大多数研究解决方案都是临时工作负载,不需要长时间使用。此体系结构被设计为具有可用性区域的单个区域部署。如果业务需求需要更高的可用性,请在多个地区复制此体系结构。您将需要其他组件,如全局负载均衡器和分发服务器来将流量路由到所有这些区域。作为恢复策略的一部分,强烈建议使用Azure image Builder捕获并创建自定义基本映像的副本。

数据科学虚拟机的大小和类型应适合所执行的工作风格。该体系结构旨在支持单个研究项目,通过调整虚拟机的大小和类型以及为Azure机器学习可用的计算资源所做的选择来实现可扩展性。

成本优化


成本优化是指寻找减少不必要费用和提高运营效率的方法。有关更多信息,请参阅成本优化支柱概述。

DSVM的成本取决于底层VM系列的选择。由于工作负载是临时的,因此建议为逻辑应用程序资源制定消耗计划。使用Azure定价计算器根据所需资源的估计大小来估计成本。


Next steps

  • Microsoft Data Science Virtual Machine (DSVM)
  • What is Azure Machine Learning?
  • Azure Machine Learning Compute
  • Introduction to Azure Blob storage
  • Introduction to Azure Data Factory
  • Azure Virtual Desktop
  • Microsoft Defender for Cloud
  • Microsoft Sentinel
  • Azure Monitor
  • Azure Policy
  • Azure Policy Guest Configuration

Related resources

  • Compare the machine learning products and technologies from Microsoft
  • Azure Machine Learning architecture
  • Scale AI and machine learning initiatives in regulated industries
  • Many models machine learning at scale with Azure Machine Learning
 

本文地址
https://architect.pub/secure-research-environment-regulated-data-azure
  • 登录 发表评论
  • 4 次浏览
发布日期
星期六, June 8, 2024 - 16:33
最后修改
星期六, June 8, 2024 - 16:42

Tags

  • Azure架构
  • Azure安全
  • 云计算
  • Azure
Article
Read more

最新内容

  • 【DeepSeek】如何为自定义数据集微调DeepSeek-R1(一步一步)
    1 week ago
  • 【UI开发】为AI应用程序构建UI的3个最佳Python框架
    2 weeks 2 days ago
  • 【前端开发】🚀🔥 改变编码方式的10个前端开发AI助手
    2 weeks 2 days ago
  • 【前端开发】生成式AI革新前端开发:传统开发模式的颠覆
    2 weeks 2 days ago
  • 【CNN架构】解释不同类型的CNN架构:示例
    2 weeks 2 days ago
  • 【信息设计】设计模式指南:学习指南
    2 weeks 2 days ago
  • 【设计思维】什么是设计思维?
    2 weeks 2 days ago
  • 【Gen UI】生成式用户界面与结果导向设计的范式革命​
    1 month 1 week ago
  • 测试Bolt.new:开发者亲测AI应用构建工具​
    1 month 1 week ago
  • 生成式用户界面(Gen UI)是什么?它重要吗?
    1 month 1 week ago

网站备案号:京ICP备2022026098号-2

友情链接

  • CPO宝典
  • 全球IT瞭望
  • 开发者开聊
  • 智能化转型智库
  • 架构师研究会

知识星球

知识星球:首席架构师圈

 

抖音直播

抖音:cea_cio(超级架构师)
干货直播,干货分享

 

微信小号

超级架构师
超级架构师小号:加群,私聊

 

微信公众号

超级架构师公众号

 

QQ群:超级架构师

QQ Group

Tags

Tags

  • Azure架构
  • Azure安全
  • 云计算
  • Azure
© 2025 架构师研究会, All rights reserved.
↑