跳转到主要内容

热门内容

今日:


总体:


最近浏览:


Chinese, Simplified

category

在本快速入门中,您可以将自己的数据与Azure OpenAI模型一起使用。在您的数据上使用Azure OpenAI的模型可以为您提供一个强大的会话式AI平台,实现更快、更准确的通信。

先决条件

  • Azure订阅-免费创建一个。
  • 部署在受支持区域并具有受支持模型的Azure OpenAI资源。
  • 请确保您至少被分配了Azure OpenAI资源的认知服务贡献者角色。
  • 如果您没有自己的数据,请从GitHub下载示例数据。


使用Azure OpenAI Studio添加数据


小贴士

您可以使用Azure Developer CLI以编程方式创建Azure OpenAI On Your Data所需的资源

导航到Azure OpenAI Studio,并使用有权访问Azure OpenAI资源的凭据登录。在登录工作流期间或之后,选择适当的目录、Azure订阅和Azure OpenAI资源。

  • 选择“自带数据互动程序”

 

Azure OpenAI Studio登录页面的屏幕截图。

  • 在出现的窗格中,选择“选择数据源”下的“上载文件(预览)”。Azure OpenAI需要存储资源和搜索资源来访问和索引您的数据。

小贴士

  • 有关更多信息,请参阅以下资源:
    • 数据源选项
    • 支持的文件类型和格式
  • 对于包含长文本的文档和数据集,我们建议使用可用的数据准备脚本【data preparation script
    • 为了让Azure OpenAI访问您的存储帐户,您需要打开跨源资源共享(CORS)。如果尚未为Azure Blob存储资源打开CORS,请选择打开CORS。
  • 选择您的Azure AI搜索资源,并选择确认连接该资源将在您的帐户上使用。然后选择下一步。

显示在Azure OpenAI Studio中选择数据源的选项的屏幕截图。

  • 在上传文件窗格中,选择浏览文件,然后选择从先决条件部分下载的文件或您自己的数据。然后选择上传文件。然后选择下一步。
  • 在“数据管理”窗格中,您可以选择是为索引启用语义搜索还是矢量搜索。

重要事项

  • 语义搜索和矢量搜索需要额外定价。您需要选择基本SKU或更高SKU以启用语义搜索或矢量搜索。有关更多信息,请参阅定价级别差异和服务限制。
  • 为了帮助提高信息检索和模型响应的质量,我们建议对以下数据源语言启用语义搜索:英语、法语、西班牙语、葡萄牙语、意大利语、德国语、汉语、日语、韩语、俄语和阿拉伯语。
     
  • 查看您输入的详细信息,然后选择“保存并关闭”。现在,您可以与模型聊天,它将使用您的数据中的信息来构建响应。


聊天游乐场


通过聊天平台,以无代码的方式开始探索Azure OpenAI功能。它只是一个文本框,您可以在其中提交提示以生成完成。从这个页面,您可以快速迭代和实验这些功能。

Azure OpenAI Studio游乐场页面的屏幕截图,突出显示了部分内容。

游乐场为您提供了定制聊天体验的选项。在右侧,您可以选择部署,以确定哪个模型使用索引中的搜索结果生成响应。您可以选择要包含为未来生成的回复的对话历史记录的过去消息的数量。对话历史记录提供了生成相关响应的上下文,但也消耗了令牌的使用。输入标记进度指示器跟踪您提交的问题的标记计数。

左侧的高级设置是运行时参数,它使您可以控制从数据中检索和搜索相关信息。一个好的用例是,当你想确保仅根据你的数据生成响应,或者你发现模型无法根据你数据上的现有信息生成响应时。

  • 严格性决定了系统根据相似性得分过滤搜索文档的积极性。将严格性设置为5表示系统将积极过滤文档,应用非常高的相似性阈值。语义搜索在这种情况下可能会有所帮助,因为排名模型在推断查询意图方面做得更好。较低的严格程度会产生更详细的答案,但也可能包括不在索引中的信息。默认设置为3。
  • 检索到的文档是一个整数,可以设置为3、5、10或20,并控制提供给大型语言模型以制定最终响应的文档块的数量。默认情况下,该值设置为5。
  • 启用“限制对数据的响应”后,模型将尝试仅依赖您的文档进行响应。默认情况下,此设置为true。

高级设置的屏幕截图。

发送您的第一个查询。聊天模型在问答练习中表现最佳。例如,“我有哪些可用的健康计划?”或“健康+选项是什么?”。

需要数据分析的查询可能会失败,例如“哪种健康计划最受欢迎?”。需要有关您所有数据的信息的查询也可能失败,例如“我上传了多少文档?”。请记住,搜索引擎会查找与查询具有精确或相似的术语、短语或结构的块。虽然模型可能理解这个问题,但如果搜索结果是数据集中的块,那么它就不是回答这类问题的正确信息。

聊天受到响应中返回的文档(块)数量的限制(在Azure OpenAI Studio游乐场中限制为3-20个)。正如你所想象的,提出一个关于“所有标题”的问题需要对整个矢量存储进行全面扫描。

部署您的模型


一旦您对Azure OpenAI studio的体验感到满意,您就可以通过选择deploy to按钮直接从studio部署web应用程序。

显示Azure OpenAI Studio中模型部署按钮的屏幕截图。

这使您可以选择部署到独立的web应用程序,或者如果您在模型上使用自己的数据,则可以在copilot Studio(预览版)中部署副本。

例如,如果您选择部署web应用程序:

首次部署web应用程序时,应选择“创建新的web应用程序”。为应用程序选择一个名称,该名称将成为应用程序URL的一部分。例如,https://<appname>.azurewebsites.net

为已发布的应用程序选择订阅、资源组、位置和定价计划。要更新现有应用程序,请选择“发布到现有web应用程序”,然后从下拉菜单中选择以前应用程序的名称。

如果您选择部署web应用程序,请参阅使用它的重要注意事项【important considerations】。


清理资源


如果要清理和删除Azure OpenAI或Azure AI搜索资源,可以删除该资源或资源组。删除资源组也会删除与其关联的任何其他资源。

Next steps

本文地址
最后修改
星期一, 八月 5, 2024 - 21:30
Article