跳转到主要内容

热门内容

今日:


总体:


最近浏览:


Chinese, Simplified

category

本文提供了有关如何处理、使用和存储您提供给Azure OpenAI服务的数据的详细信息。Azure OpenAI存储和处理数据以提供服务并监控违反适用产品条款的使用。另请参阅Microsoft产品和服务数据保护附录,该附录管理Azure OpenAI服务的数据处理,除非适用的产品条款中另有规定。

重要的

您的提示(输入)和完成(输出)、嵌入和训练数据:

  • 其他客户无法使用。
  • 不可用于OpenAI。
  • 不用于改进OpenAI模型。
  • 不用于改进任何Microsoft或第三方产品或服务。
  • 不用于自动改进Azure OpenAI模型以供您在资源中使用(这些模型是无状态的,除非您明确地使用训练数据对模型进行微调)。
    您经过微调的Azure OpenAI模型仅供您使用。
  • Azure OpenAI服务完全由微软控制;Microsoft在Microsoft的Azure环境中托管OpenAI模型,并且该服务不与OpenAI运营的任何服务(例如,ChatGPT或OpenAI API)交互。

 

Azure OpenAI服务处理哪些数据?


Azure OpenAI处理以下类型的数据:

  • 提示和生成的内容。提示由用户提交,内容由服务通过完成、聊天完成、图像和嵌入操作生成。
  • 提示中包含的增强数据。当使用“on your data”功能时,该服务从配置的数据存储中检索相关数据,并增强提示以生成基于您的数据的生成。
  • 培训和验证数据。您可以提供自己的训练数据,这些数据由即时完成对组成,用于微调OpenAI模型


Azure OpenAI服务如何处理数据?


下图说明了如何处理您的数据。此图涵盖三种不同类型的处理:

  • Azure OpenAI服务如何处理您的提示以生成内容(包括何时使用Azure OpenAI将来自连接数据源的其他数据添加到提示中)。
  • Azure OpenAI服务如何使用您的训练数据创建微调(自定义)模型。

Azure OpenAI服务和Microsoft人员如何分析提示、完成和图像中的有害内容,以及表明以违反行为准则或其他适用产品条款的方式使用该服务的模式
 

服务的数据流图

如上图所示,托管客户可以申请修改滥用监控。

生成补全、图像或嵌入


部署在资源中的模型(基本的或微调的)处理您的输入提示,并使用文本、图像或嵌入生成响应。提示和响应在客户指定的地理区域内进行处理,但出于运营目的(包括性能和容量管理),可能会在地理区域内的区域之间进行处理。该服务被配置为实时同步评估提示和完成数据,以检查有害内容类型,并停止生成超过配置阈值的内容。在Azure OpenAI服务内容过滤上了解更多信息。

模型是无状态的:模型中不存储任何提示或生成。此外,提示和生成不用于训练、重新训练或改进基本模型。

使用从数据源检索到的数据增强提示,以“固定”生成的结果


Azure OpenAI“在你的数据上”功能允许你连接数据源,将生成的结果与你的数据联系起来。数据仍存储在您指定的数据源和位置中。没有数据被复制到Azure OpenAI服务中。当接收到用户提示时,该服务从连接的数据源检索相关数据并增强提示。该模型处理该增强的提示,并且如上所述返回生成的内容。

使用您自己的数据的数据流程图

如上图所示,托管客户可以申请修改滥用监控。

使用您的数据创建自定义(微调)模型:


客户可以将他们的培训数据上传到服务中,以便对模型进行微调。上传的培训数据存储在客户Azure租户的Azure OpenAI资源中。培训数据和微调模型:

  • 仅供客户使用。
  • 存储在与Azure OpenAI资源相同的区域内。
  • 可以在静止时进行双重加密(默认情况下使用Microsoft的AES-256加密,也可以选择使用客户管理的密钥)。
  • 客户可以随时删除。
     

上传用于微调的训练数据不用于训练、再培训或改进任何Microsoft或第三方基础模型。

防止滥用和有害内容生成


为了降低有害使用Azure OpenAI服务的风险,Azure OpenAI Service包括内容过滤和滥用监控功能。若要了解有关内容筛选的更多信息,请参阅Azure OpenAI服务内容筛选。若要了解关于滥用监控的详细信息,请参见滥用监控。

内容过滤在服务进程提示生成内容时同步进行,如上所述。内容分类器模型中不存储任何提示或生成的结果,并且提示和结果不用于训练、再训练或改进分类器模型。

Azure OpenAI滥用监控检测并缓解重复出现的内容和/或行为的实例,这些内容和行为表明使用服务的方式可能违反行为准则或其他适用的产品条款。为了检测和减轻滥用,Azure OpenAI将所有提示和生成的内容安全存储长达三十(30)天。(如果客户被批准并选择关闭滥用监控,则不会存储任何提示或完成信息,如下所述。)

存储提示和完成的数据存储在逻辑上按客户资源分开(每个请求都包括客户的Azure OpenAI资源的资源ID)。在Azure OpenAI服务可用的每个区域中都有一个单独的数据存储,客户的提示和生成的内容存储在Azure Open人工智能服务边界内部署客户的Azure OpenAI资源的Azure区域中。只有当滥用监测系统标记了提示和完成数据时,评估潜在滥用的人类审查人员才能访问这些数据。人工审核人员是经授权的Microsoft员工,他们使用请求ID、安全访问工作站(SAW)和团队经理批准的实时(JIT)请求通过点式查询访问数据。对于部署在欧洲经济区的Azure OpenAI服务,授权的微软员工位于欧洲经济区。

客户如何获得滥用监控和人为审查的豁免?


一些客户可能希望将Azure OpenAI服务用于涉及敏感、高度机密或受法律监管的输入数据处理的用例,但有害输出和/或滥用的可能性很低。这些客户可能会得出结论,由于其内部政策或适用的法律法规,他们不希望或无权允许Microsoft处理此类数据以进行滥用检测,如上所述。为了解决这些问题,微软允许满足额外的有限访问资格标准并证明特定用例的客户通过填写此表格来申请修改Azure OpenAI内容管理功能。

如果Microsoft批准了客户修改滥用监控的请求,则Microsoft不会存储与已批准的Azure订阅相关联的任何提示和完成信息,该订阅的滥用监控已被配置为关闭。在这种情况下,由于没有任何提示和完成信息存储在服务结果存储中,因此无法执行人工审核过程。有关更多信息,请参阅滥用监测。

客户如何验证用于滥用监控的数据存储是否关闭?


一旦客户被批准关闭滥用监控,有两种方法可以验证其批准的Azure订阅中用于滥用监控的数据存储是否已关闭:

使用Azure门户,或
Azure CLI(或任何管理API)。

笔记

只有当用于滥用监控的数据存储关闭时,“ContentLogging”属性的值“false”才会出现。否则,此属性将不会出现在Azure门户或Azure CLI的输出中。

先决条件

  • 登录Azure
  • 选择承载Azure OpenAI服务资源的Azure订阅。
  • 导航到Azure OpenAI服务资源的概览页面。


使用Azure门户进行日志记录状态验证:

 

  • 转到资源概述页面
  • 单击右上角的JSON视图链接,如下图所示。

Azure门户中的日志状态json视图。

“功能”列表中将有一个名为“ContentLogging”的值,当滥用监控日志记录关闭时,该值将显示并设置为FALSE。

{ "name":"ContentLogging", "value":"false" }


使用Azure CLI(或其他管理API)进行日志记录状态验证:

在Azure CLI中执行以下命令以查看上面Azure门户中显示的相同JSON数据。

az cognitiveservices account show -n resource\_name -g resource \_group


要了解有关Microsoft隐私和安全承诺的更多信息,请访问Microsoft信任中心。

更改日志

Date Changes
23 June 2023 Added information about data processing for new Azure on your data feature; removed information about abuse monitoring which is now available at Azure OpenAI Service abuse monitoring. Added summary note. Updated and streamlined content and updated diagrams for additional clarity. added change log

另请参阅

本文地址
最后修改
星期四, 七月 4, 2024 - 11:18
Article