跳转到主要内容

热门内容

今日:


总体:


最近浏览:


Chinese, Simplified

category

Azure人工智能搜索(以前称为“Azure认知搜索”)在传统和生成人工智能搜索应用程序中提供了超过用户拥有内容的安全信息检索。

信息检索是任何显示文本和矢量的应用程序的基础。常见的场景包括目录或文档搜索、数据探索,以及越来越多的基于专有基础数据的聊天式应用程序。创建搜索服务时,您可以使用以下功能:

  • 一种用于矢量搜索、全文搜索和搜索索引上的混合搜索的搜索引擎
  • 丰富的索引,具有集成的数据分块和矢量化(预览)、文本词汇分析以及用于内容提取和转换的可选应用人工智能
  • 用于矢量查询、文本搜索、混合查询、模糊搜索、自动完成、地理搜索等的丰富查询语法
  • Azure的规模、安全性和覆盖范围
  • Azure在数据层、机器学习层、Azure AI服务和Azure OpenAI的集成

从体系结构上讲,搜索服务位于包含未编入索引的数据的外部数据存储和向搜索索引发送查询请求并处理响应的客户端应用程序之间。

Azure AI搜索架构

在您的客户端应用程序中,搜索体验是使用Azure AI search的API定义的,可以包括相关性调整、语义排名、自动完成、同义词匹配、模糊匹配、模式匹配、筛选和排序。

在整个Azure平台上,Azure人工智能搜索可以以索引器的形式与其他Azure服务集成,索引器可以自动从Azure数据源中获取/检索数据,技能集可以结合Azure人工智能服务中的可消费人工智能,如图像和自然语言处理,或您在Azure机器学习中创建的自定义人工智能,或封装在Azure函数中。

搜索服务内部


在搜索服务本身上,两个主要工作负载是索引和查询。

索引

索引是一个将内容加载到搜索服务中并使其可搜索的吸收过程。在内部,入站文本被处理成令牌并存储在反向索引中,而入站矢量则存储在矢量索引中。Azure AI Search可以索引的文档格式是JSON。您可以上传已组装的JSON文档,也可以使用索引器将数据检索并序列化为JSON。

应用人工智能通过一套技能扩展了图像和语言模型的索引。如果源文档中有图像或大型非结构化文本,则可以附加执行OCR、描述图像、推断结构、翻译文本等技能。您还可以附加执行数据分块和向量化的技能。

搜索

一旦索引中填充了可搜索的内容,当您的客户端应用程序向搜索服务发送查询请求并处理响应时,就可以进行查询。所有查询执行都在您控制的搜索索引上进行。

语义排序是查询执行的扩展。它增加了二级排名,使用语言理解来重新评估结果集,将语义最相关的结果提升到顶部。

为什么使用Azure AI搜索?


Azure AI搜索非常适合以下应用场景:

  • 将其用于传统的全文搜索和下一代矢量相似性搜索。利用关键词和相似性搜索的优势,为您的生成型人工智能应用程序提供信息检索支持。使用这两种模式检索最相关的结果。
  • 将异构内容整合到由矢量和文本组成的用户定义和填充的搜索索引中。您保持对可搜索内容的所有权和控制权。
  • 为生成AI和RAG应用程序集成数据分块和矢量化。
  • 在文档级别应用细粒度访问控制。
  • 将索引和查询工作负载卸载到专用搜索服务上。
  • 轻松实现搜索相关功能:相关性调整、分面导航、过滤器(包括地理空间搜索)、同义词映射和自动完成。
  • 将大型无差别文本或图像文件,或存储在Azure Blob Storage或Azure Cosmos DB中的应用程序文件转换为可搜索的块。这是通过添加Azure AI外部处理的认知技能在索引过程中实现的。
  • 添加语言或自定义文本分析。如果你有非英语内容,Azure AI Search同时支持Lucene分析器和微软的自然语言处理器。您还可以配置分析器来实现对原始内容的专门处理,例如过滤掉变音符号,或者识别和保留字符串中的模式。

有关特定功能的更多信息,请参阅Azure AI搜索的功能

如何开始


功能通过Azure门户、简单的REST API或Azure SDK(如的Azure SDK)公开。NET。Azure门户支持服务管理和内容管理,并提供用于原型设计和查询索引和技能集的工具。

核心搜索功能的端到端探索可以通过四个步骤完成:

  1. 决定一个层次和区域。每个订阅允许一个免费搜索服务。所有快速启动都可以在免费层上完成。要获得更多容量和功能,您需要一个可计费的层。
  2. 在Azure门户中创建搜索服务。
  3. 从导入数据向导开始。选择内置示例或支持的数据源以在几分钟内创建、加载和查询索引。
  4. 使用Search Explorer完成,使用门户客户端查询您刚刚创建的搜索索引。

或者,您可以按原子步骤创建、加载和查询搜索索引:

  1. 使用门户REST API创建搜索索引。NET SDK或其他SDK。索引模式定义了可搜索内容的结构。
  2. 使用“推送”模型上传内容以推送来自任何来源的JSON文档,或者如果源数据属于受支持的类型,则使用“拉取”模型(索引器)。
  3. 使用门户中的搜索资源管理器REST API查询索引。NET SDK或其他SDK。

提示

有关复杂或自定义解决方案的帮助,请联系在Azure AI搜索技术方面具有深厚专业知识的合作伙伴。

比较搜索选项


客户经常会问Azure人工智能搜索与其他搜索相关解决方案相比如何。下表总结了主要差异。

Compared to Key differences
Microsoft Search Microsoft Search适用于需要在SharePoint中查询内容的经过Microsoft 365身份验证的用户。Azure人工智能搜索通过Azure和任何JSON数据集获取内容。
Bing Bing API在Bing.com上的索引中查询匹配的术语。Azure AI搜索在由您的内容填充的索引上进行搜索。您可以控制数据接收和模式
Database search Azure SQL有全文搜索和矢量搜索。Azure Cosmos DB还提供文本搜索和矢量搜索。当您需要相关性调整或来自异构来源的内容等功能时,Azure AI搜索将成为一种有吸引力的替代方案。资源利用率是另一个转折点。索引和查询是计算密集型的。从DBMS卸载搜索可保留用于事务处理的系统资源。
Dedicated search solution 假设您已经决定使用具有全谱功能的专用搜索,那么最终的分类比较是搜索技术之间的比较。在云提供商中,Azure AI搜索在矢量、关键字和混合工作负载方面比Azure上的内容最强,适用于主要依赖搜索进行信息检索和内容导航的应用程序。

主要优势包括:

  • 支持矢量和非矢量(文本)索引和查询。使用向量相似性搜索,即使搜索词不完全匹配,也可以找到与搜索查询语义相似的信息。使用混合搜索以获得最佳的关键字和矢量搜索。
  • 通过语义排名和评分档案进行排名和相关性调整。查询语法支持术语增强和字段优先级排序。
  • 索引层的Azure数据集成(爬网程序)。
  • Azure AI集成,用于使内容文本和矢量可搜索的转换。
  • 用于可信连接的Microsoft Entra安全性,以及用于无互联网场景下的私人连接的Azure Private Link。
  • 完整的搜索体验:56种语言的语言和自定义文本分析。分面、自动完成查询和建议结果以及同义词。
  • Azure的规模、可靠性和全球覆盖范围。
     
本文地址
最后修改
星期四, June 27, 2024 - 11:55
Article