category
有几种技术可以调整预先训练的语言模型以适应特定的任务或领域。其中包括即时工程、RAG(Retrieval Augmented Generation)和微调。这三种技术并不相互排斥,而是互补的方法,结合起来可以应用于特定的用例。在本文中,我们将探讨这些技术、说明性用例、需要考虑的事项,并提供到资源的链接,以了解更多信息并开始使用每种技术。
提示工程
释义
提示工程是一种艺术和科学的技术,涉及为生成的人工智能模型设计提示。该过程利用了上下文学习(零次射门和少量射门),并通过迭代提高了响应的准确性和相关性,优化了模型的性能。
说明性用例
有环保意识的公司的营销经理可以使用即时工程来帮助指导模型生成更符合其品牌基调和风格的描述。例如,他们可以在输入中添加诸如“为一系列新的环保清洁产品编写产品描述,强调质量、有效性,并强调使用环保成分”之类的提示。这将有助于模型生成与其品牌价值观和信息一致的描述。
需要考虑的事项
即时工程是从生成的人工智能模型中生成所需输出的起点。
制作清晰的说明:说明通常用于提示和指导模型的行为。要具体,尽可能少留解释的余地。使用类比和描述性语言帮助模型理解您想要的结果。
实验和迭代:即时工程是一门需要实验和迭代的艺术。练习并获得为不同任务制作提示的经验。每个模型的行为可能不同,因此相应地调整及时的工程技术很重要。
开始
- Introduction to prompt engineering
- Prompt engineering techniques
- 15 tips to become a better prompt engineer for generative AI
- The basics of prompt engineering (video)
RAG(检索增强生成)
释义
RAG(Retrieval Augmented Generation,检索增强生成)是一种将外部数据集成到大型语言模型提示中以生成相关响应的方法。当使用基于不同主题的大型非结构化文本语料库时,这种方法尤其有益。它允许以组织的知识库(KB)为基础提供答案,从而提供更具针对性和准确性的响应。
当基于组织的私人数据回答问题时,或者当模型所训练的公共数据可能已经过时时,RAG也是有利的。这有助于确保响应始终是最新的和相关的,无论数据环境如何变化。
说明性用例
公司人力资源部门正在寻求提供一个智能助理,回答特定的员工健康保险相关问题,如“是否包括眼镜?”RAG用于获取与保险计划政策相关的大量文件,以回答这些特定类型的问题。
需要考虑的事项
- RAG有助于将人工智能输出固定在真实世界的数据中,并降低制造的可能性。
- 当需要回答基于私人专有数据的问题时,RAG很有帮助。
- 当您可能想要回答最近的问题时(例如,在模型版本上次训练的截止日期之前),RAG非常有用。
开始
- Retrieval Augmented Generation in Azure AI Studio - Azure AI Studio | Microsoft Learn
- Retrieval Augmented Generation (RAG) in Azure AI Search
- Retrieval Augmented Generation using Azure Machine Learning prompt flow (preview)
微调
释义
微调,特别是在这种情况下的监督微调,是一个迭代过程,它使现有的大型语言模型适应所提供的训练集,以提高性能、教授模型新技能或减少延迟。当模型需要学习和概括特定主题时,特别是当这些主题的范围通常很小时,会使用这种方法。
微调需要使用基于特殊示例的格式的高质量训练数据来创建新的微调大型语言模型。通过专注于特定主题,微调使模型能够在这些关注领域内提供更准确和相关的响应。
说明性用例
一个IT部门一直在使用GPT-4将自然语言查询转换为SQL,但他们发现响应并不总是可靠地基于他们的模式,而且成本高得令人望而却步。
他们用数百个请求和正确的响应对GPT-3.5-Turbo进行微调,并生成一个比基本模型性能更好、成本和延迟更低的模型。
需要考虑的事项
微调是一种高级功能;它利用截止日期后的知识和/或领域特定知识来增强LLM。在考虑此选项之前,首先根据标准模型的要求评估其基线性能。- 有一个没有微调的性能基线对于了解微调是否提高了模型性能至关重要。使用坏数据进行微调会使基本模型变得更糟,但如果没有基线,则很难检测到回归。
- 微调的好例子包括引导模型以特定和自定义的风格、音调或格式输出内容,或者引导模型所需的信息太长或太复杂而无法放入提示窗口的任务。
- 微调成本:
- 微调可以降低两个维度的成本:(1)根据任务使用更少的令牌;(2)使用更小的模型(例如,GPT 3.5 Turbo可能会进行微调,以在特定任务上实现与GPT-4相同的质量)。
- 微调会产生培训模型的前期成本。以及部署自定义模型后托管该模型的额外小时成本。
开始
- 登录 发表评论
- 8 次浏览
最新内容
- 1 day 3 hours ago
- 1 day 3 hours ago
- 1 day 3 hours ago
- 1 day 3 hours ago
- 1 day 10 hours ago
- 2 days 8 hours ago
- 1 week 4 days ago
- 1 week 4 days ago
- 1 week 4 days ago
- 1 week 4 days ago