category
语义索引是Microsoft 365搜索的一项新功能,它使用Microsoft Graph更好地与您的个人和组织数据进行交互。它创建了一个新的索引,使搜索和复制体验的未来成为可能。语义索引遵循Microsoft Graph的安全性和策略。每当用户通过搜索或在Microsoft Copilot中查询时,都会显示用户的安全上下文,并且只显示用户可以访问的内容。
概述
语义索引位于Microsoft Graph之上,它解释用户查询以产生上下文相关的响应,帮助您提高工作效率。它允许组织搜索数十亿个向量(特征或属性的数学表示)并返回相关结果。结合Microsoft Graph的增强功能,语义索引将您与组织中的相关信息联系起来,并建立在Microsoft的全面方法之上,以确保安全性、合规性、隐私性,并尊重租户内部的所有组织边界。
什么是索引?
索引数据的概念在Microsoft 365中已经确立,并且是Microsoft Graph如何访问当今Microsoft 365租户中大量数据的正常部分。用户可以从Microsoft Graph看到搜索结果,该图对租户中大多数Microsoft 365应用程序的内容和信号进行索引,以确保搜索结果是个性化的,并根据您的内容与网络中的人员之间的连接进行提升。
与Microsoft Graph中数据的交互基于关键字匹配、个性化和社交匹配。针对Microsoft Graph中的索引进行关键字搜索查询,该索引映射到文档或一组文档中的位置。Microsoft 365使用Microsoft Graph根据其对用户及其亲密网络的其他信号的了解对最相关的内容进行排名。这在Microsoft 365中称为个性化和社交匹配,它可以提高对组织中内容的查询的相关性。对Microsoft Graph中租户数据的访问由基于角色的访问控制来控制。组织始终通过Microsoft 365管理中心的搜索和智能门户控制Microsoft搜索功能。
语义索引如何帮助管理数据
语义索引增强了Microsoft 365的功能,使您能够根据关键字、个人偏好和社交关系查找相关内容。它通过创建矢量化索引来实现这一点,这些索引可以实现概念理解,这有助于识别您正在寻找的内容,并帮助您访问所需的组织内容。向量是单词、图像像素或其他数据点的数值表示。向量被排列或映射为彼此接近的紧密数字,以表示相似性。与标准关键字索引不同,向量存储在多维空间中,语义相似的数据点在向量空间中聚集在一起,使Microsoft 365能够处理超出“精确匹配”范围的更广泛的搜索查询。下图使用文本(而不是矢量化索引使用的数字)来显示数据点之间的相似性示例:
显示语义索引数据点如何聚类在一起的示例的图形。
语义索引根据数据的向量距离或相似性提供快速准确的相似性搜索和检索。这意味着,语义索引可以根据语义或上下文含义找到最相似或最相关的数据,而不是使用基于精确匹配或预定义标准的传统查询方法。
特征
以下语义索引特征不仅增强了搜索结果;它们协同工作,帮助您了解数据,更快地查找信息并提高生产率。用户最初将能够通过Microsoft Copilot for Microsoft 365集成与语义索引进行交互。随着时间的推移,微软还将通过语义索引改善SharePoint Online、Microsoft Teams和Microsoft 365应用程序的搜索体验。我们正在为我们的Microsoft 365 E3/E5和Microsoft 365 Business Standard和Business Premium客户推出语义索引。我们还将语义索引扩展到拥有付费Copilot许可证的Microsoft 365 A3、A5、Office 365 E3和E5用户。有关可用性的状态更新通过“Microsoft 365管理中心”和“Microsoft 365公共路线图”共享。以下是您查找信息时每个功能如何工作的详细信息。
微软Copilot与Graph聊天
语义索引通过理解查询的意图并将其他信息附加到Microsoft Copilot提示中,帮助在基于图形的聊天中显示结果。在Microsoft Graph和语义索引中获取相关信息,为LLM提供更多信息进行推理。例如,假设您希望Microsoft Copilot找到一封同事赞扬供应商设计工作的电子邮件。语义索引将附近的单词(例如,高兴、兴奋、惊讶)纳入搜索范围,以扩大搜索范围并给出最佳结果。所有这些工作都发生在幕后,为您使用Microsoft Copilot搜索的结果增加相关性,而不会增加复杂性。
语义搜索
语义搜索捕获查询的语义含义,以便语义相似的文本具有相似的数值,从而更好地理解语言。通过使用向量,语义搜索可以理解不同形式的单词之间的关系(例如,tech、technology、technologies;USA、U.S.A、United States、United of America;dog、cat、pet),并自然地捕获同义词,以扩大可搜索的信息量。这些改进有助于语义搜索理解句子、片段、文档、会议的意图。它还可以识别与您的查询或示例内容相关的资产,并为用户与Microsoft 365的Microsoft Copilot交互做好准备。
语义索引的工作原理
语义索引增强了Microsoft 365应用程序、SharePoint Online和Microsoft Teams中的Microsoft Copilot和搜索结果。它通过创建两个索引来实现这一点,以支持增强的搜索体验和对Microsoft自动启用的在线数据的概念理解。
用户级索引仅在一组工作数据上为您的眼睛创建个性化索引,并使您更容易在日常任务中使用。这包括您制作或与之交互的任何基于文本的内容,如电子邮件、提及您的文档,或您评论或分享的内容。租户级索引添加了基于文本的SharePoint Online文件,组织中的两个或多个人可以通过网站继承访问这些文件。但是,只有当用户已经可以访问基于角色的访问控制所控制的内容时,它才会向用户显示结果。此外,SharePoint Online网站必须保持可搜索状态。
以下部分解释了如何启用每个索引,Copilot for Microsoft 365中的数据流如何使用语义索引,每个索引可以处理哪些文件类型,以及每个索引如何处理更新。
支持
我们正处于向所有拥有适用于Microsoft 365的Copilot和符合条件的Microsoft 365许可证的组织推出语义索引的早期阶段,无需任何管理参与。
我们收到了客户的反馈,称以前在Microsoft 365管理中心中的语义索引启用状态指示器令人困惑。为了减少客户的困惑,我们暂时删除了该指标,直到我们能够确定更好的方法。我们为客户提供卓越搜索体验的承诺没有改变,微软将继续自动为组织建立索引。
数据流
语义索引与Microsoft Graph交互,为用户提供对用户级和租户级索引中信息的访问。下图显示了使用Copilot for Microsoft 365的请求的数据流是如何工作的。
显示Microsoft 365的Copilot、Microsoft 365应用程序、Microsoft Graph和大型语言模型之间关系的图形。
- 来自Microsoft 365应用程序的用户提示被发送到Copilot(1),
- Copilot访问Microsoft Graph和语义索引进行处理(2)。
- Copilot将修改后的提示发送到大型语言模型(3),
- 接收LLM响应(4),
- 然后访问Microsoft Graph和语义索引进行后处理(5)。
- 然后,Copilot将响应和应用程序命令发送回Microsoft 365应用程序。
所有请求都通过HTTPS加密,客户数据在静止状态下保持加密。
支持的内容类型
语义索引支持对下表中列出的用户邮箱和文件类型进行索引,随着时间的推移支持更多的文件类型。表中包含用户级索引和租户级索引支持的文件类型列表。
Content/file type | User level | Tenant level |
---|---|---|
User Mailbox | Supported | Not applicable |
Delegated Mailbox | Not supported | Not applicable |
Shared Mailbox | Not supported | Not applicable |
Archived Mailbox Data | Not supported | Not applicable |
Archived SharePoint Data | Not supported | Not supported |
Word documents (doc/docx) | Supported | Supported |
PowerPoint (pptx) | Supported | Supported |
PDF files | Supported | Supported |
Web pages (aspx) | Supported | Supported |
OneNote files (one) | Supported | Supported |
Graph Connector data | Not applicable | Supported |
索引更新
当语义索引首次为客户完成索引时,用户创建的文档将在用户的邮箱中近乎实时地进行索引。添加到SharePoint Online网站的新文档每天都会被编入索引,这些文档可以通过网站继承由两个或多个用户访问。当更新索引的用户和租户级文档时,这些更改会立即被索引。
管理
我们为管理员提供可选活动,通过Microsoft 365管理中心准备和管理语义索引。启用语义索引不需要管理参与,因为该服务是由Microsoft自动启用的。语义索引是对Microsoft 365搜索的改进,不能禁用。
管理员可以通过查看在SharePoint中规划和部署文件协作的考虑因素以及在SharePoint现代体验中共享权限来选择准备和管理语义索引。管理员可以通过查看使用Microsoft权限数据丢失防护(DLP)排除数据的注意事项,选择从语义索引中排除文件。如果不存在DLP解决方案,管理员可以从租户级索引中排除SharePoint Online网站。
不包括SharePoint联机网站
有时,没有Microsoft权限数据丢失防护的组织可能希望排除SharePoint Online网站的数据被Microsoft Search索引。这些步骤只应考虑用于敏感数据,如工资单、人力资源或财务信息。要排除SharePoint Online网站,请执行以下步骤:
- 浏览到具有适当管理员权限的网站。
- 从下拉菜单中选择设置,然后选择站点信息。
- 选择“查看所有网站设置”以打开“网站设置”页面。
- 在“搜索”类别下选择“搜索和脱机可用性”,然后在“允许此网站出现在搜索结果中”中选择“否”,以将其从Microsoft搜索和语义索引搜索中排除。对于多个站点,也可以使用PowerShell执行此操作。
Microsoft Search和语义索引仅支持从租户级索引中排除SharePoint联机内容。没有仅从Microsoft搜索或仅从语义索引中排除结果的选项;动作同时适用于两者。
配置项目洞察
在Microsoft 365管理中心的搜索和智能页面上,默认情况下启用项目洞察。关闭人员或项目洞察会降低Microsoft搜索和语义索引体验,因为结果将不包括从通讯组或组织结构图中得出的相关人员。
- 人员洞察根据用户在Microsoft 365中的公共协作工作向用户提供相关人员列表。公共协作包括公共通讯组的成员和组织结构图中连接的个人。
- 项目洞察允许根据Microsoft 365中的协作工作为组织中的人员提供建议。这些建议可能包括但不限于文档或其他类型的内容,并显示在名片(联系人)、Delve、Microsoft 365应用程序、Microsoft Copilot结果和其他位置。
项目洞察和人员洞察都不包括基于用户自己数据的个性化功能。
纳入第三方信息
语义索引为组织提供了一种方法,可以将Microsoft 365之外的组织数据或内容带入Microsoft 365和Microsoft 365生态系统的Copilot中。图形连接器允许摄取外部数据源,这有助于通过利用Microsoft 365数据和第三方数据的相关结果丰富用户的Copilot体验。Microsoft为所有Graph连接器数据建立索引,同时维护对内容的访问控制。这扩展了在您的Microsoft 365生产力应用程序和更广泛的Microsoft生态系统中可搜索的内容源类型,并且在连接器内容富含文本时效果最佳。第三方数据可以托管在本地或公共云或私有云中,这些信息由Microsoft Graph使用,Microsoft Graph可以将其纳入语义索引,以帮助您的组织提供Microsoft 365和组织的第三方内容的所有上下文。在许可证要求和定价中了解有关Microsoft 365 Enterprise和Microsoft 365 Copilot的图形连接器许可要求的更多信息。
此外,现在还提供了30多个插件和图形连接器,包括由Bing、Microsoft Boom、Jira、Trello、Mural、Confluence、Freshworks和Priority Matrix提供支持的Web搜索。随着我们将现有的Teams消息扩展和Microsoft Power Platform连接器与Microsoft 365的Copilot集成,未来几个月将启用数千个额外的业务线和第三方插件。随着我们改变共同完成工作的方式,每天用于工作的工具中出现的用于Microsoft 365的Copilot插件的广泛生态系统将为我们的共同客户带来前所未有的价值。
隐私、合规和安全
Microsoft 365租户中的权限模型可以帮助确保数据不会在用户、组和租户之间无意泄漏。语义索引仅显示每个人都可以使用与其他Microsoft 365服务中使用的数据访问相同的底层控件访问的数据。语义索引尊重基于用户身份的访问边界,因此基础进程只访问当前用户有权访问的内容。有关详细信息,请参阅Microsoft的隐私政策和服务文档。
Microsoft Copilot for Microsoft 365符合我们对Microsoft 365商业客户的现有隐私、安全和合规承诺,包括《通用数据保护条例》(GDPR)和欧盟(EU)数据边界。通过语义索引访问的提示、响应和数据不用于训练基础LLM,包括Copilot for Microsoft 365使用的LLM。有关详细信息,请参阅Microsoft 365复制副本的数据、隐私和安全。
储存和加工
语义索引生成的数据保留在您公司的租户内,并符合您的安全、合规、身份和隐私政策和流程。语义索引仅适用于用户已经拥有权限的内容,不影响存储配额。
用户级索引信息存储在用户邮箱所在的位置,租户级索引信息则存储在SharePoint站点所在区域(主区域或租户管理员指定的其他区域)中的一个隔离且受保护的客户租户容器中。对于欧盟数据边界(EUDB)内的客户,索引存储在基于EU/EFTA的数据中心中。处理其他客户可以在租户地区或美国进行。对于多地域组织,尊重所有地理边界。区域内数据在每个区域中存储和处理。在查询时,将向所有区域发送联合查询,并将语义索引和关键字搜索结果合并为对用户的一个响应。
Microsoft权限客户密钥(BYOK)支持
语义索引为在其环境中为用户级索引和租户级索引启用BYOK的企业提供BYOK支持。Microsoft自动为启用BYOK的客户启用语义索引,无需任何管理参与。
信息保护
在搜索环境中,没有其他方法可以使用信息保护功能从语义索引中排除数据。语义索引继承了Microsoft Search的安全和隐私设置,从第三方连接器引入的数据将获得与其他Microsoft 365数据相同的存储和保护。对于正在研究其他信息保护选项的组织,Microsoft 365在Microsoft 365应用程序和附加产品中提供了内置功能,以帮助管理员通过数据最小化和减少过度分享来保护组织数据。以下部分概述了可供组织参考的选项。
数据最小化
数据最小化减少了组织内可访问的数据量。出于合规和监管要求,通常需要保留和删除内容,但删除不再具有业务价值的内容也有助于您管理风险和责任。单独许可的Microsoft权限数据生命周期管理可用于删除不再需要的内容,保留策略用于大规模管理,保留标签用于异常和精细控制。
减少过度分享
长期以来,组织一直能够采取行动,使用Microsoft 365管理中心和SharePoint Online中的现有控件来减少Microsoft 365中的过度分享。值得注意的是,语义索引不会改变对内容的访问权限,也不会改变用户与同事共享信息的原则。例如,语义索引不会将与组织中每个人都能使用的链接共享的内容作为租户级索引的一部分。只有选择了他们有权访问的链接的用户才会将信息添加到他们的用户索引中。建议组织在探索信息保护选项时考虑以下因素:
- 规划安全的文件协作——审查计划并部署文件协作,以了解更多关于为用户操作安全高效的文件协作环境的推荐做法。
- 适当大小的用户访问数据以减少列表——通过继承SharePoint Online网站的排除列表并实时执行语义索引中存在的访问控制检查来减少过度分享。组织可以考虑使用Syntex SharePoint高级管理插件来管理和管理这些权限。
- 使用敏感标签-另一种方法是用Microsoft权限信息保护敏感标签标记数据。应用加密的标签使用使用使用权限来提供额外的保护层,这些也包含在搜索修剪中(即,支持用于视觉标记和访问限制的过滤和应用程序端规则)。
- 限制访问-Microsoft 365 E5中提供了Microsoft权限数据丢失防护,可用于追溯和临时限制对报告为过度共享的文档的访问。如果您不是Microsoft 365 E5客户,组织可以使用90天的Microsoft权限解决方案试用版来探索其他权限功能如何帮助您的组织管理数据安全和合规性需求。
对于有兴趣探索如何部署高级信息保护解决方案的客户,请查看以下文章,该文章解释了如何使用Microsoft权限部署信息保护解决方法。有关Microsoft权限如何帮助您加强适用于Microsoft 365的复制副本的数据安全性和合规性要求的详细信息,请参阅保护和管理与Microsoft权限的Microsoft 365复制副本交互。
额外资源
Microsoft 365、Microsoft Graph和语义索引利用Microsoft 365数据为搜索、聊天和副驾驶提供了前所未有的表现力。这种表现力有助于在Microsoft 365和Copilot for Microsoft 365中显示正确的基础数据,以充分利用您的组织数据。
要了解有关适用于Microsoft 365的Copilot的更多信息,请查看以下资源:
- 登录 发表评论
- 9 次浏览
最新内容
- 15 hours ago
- 17 hours ago
- 17 hours 46 minutes ago
- 3 days 8 hours ago
- 3 days 16 hours ago
- 3 days 16 hours ago
- 3 days 17 hours ago
- 3 days 17 hours ago
- 1 week 1 day ago
- 1 week 1 day ago