跳转到主要内容

热门内容

今日:


总体:


最近浏览:


Chinese, Simplified

category

访问我们的提示工程教程,通过互动课程学习提示。

Claude 提供了高水平的底线表现开箱即用。然而,即时工程可以帮助您进一步提高其性能,并微调其响应,以更好地适应您的特定用例。这些技术对于Claude取得好的结果不是必要的,但你可能会发现它们在增加输入和输出方面很有用。

要快速启动并运行提示,或将提示作为一个概念进行介绍,请参阅提示介绍。


什么是即时工程?


提示工程是一门实证科学,涉及迭代和测试提示以优化性能。在提示工程周期中花费的大部分精力实际上并不是在编写提示。相反,大多数即时工程时间都花在了开发一组强大的评估上,然后是针对这些评估进行测试和迭代。


及时的开发生命周期


我们推荐一种原则性的、测试驱动的开发方法,以确保最佳的即时性能。让我们来了解一下在为任务开发提示时使用的关键高级流程,如下图所示。

  1. 定义任务和成功标准:第一步也是最关键的一步是明确定义克劳德要执行的具体任务。这可以是从实体提取、问题回答或文本摘要到更复杂的任务,如代码生成或创造性写作。一旦你有了一个定义明确的任务,就要建立成功的标准来指导你的评估和优化过程。
    需要考虑的关键成功标准包括:
    1. 性能和准确性:模型在任务中的表现需要多好?
    2. 延迟:模型可接受的响应时间是多少?这将取决于应用程序的实时需求和用户期望。
    3. 价格:你的模型运行预算是多少?考虑每个API调用的成本、模型的大小和使用频率等因素。
      从一开始就有明确、可衡量的成功标准将帮助您在整个采用过程中做出明智的决定,并确保您正在为正确的目标进行优化。
    4. 开发测试用例:定义好任务和成功标准后,下一步是创建一组不同的测试用例,涵盖应用程序的预期用例。这些应该包括典型示例和边缘案例,以确保您的提示是稳健的。预先定义好测试用例将使您能够根据成功标准客观地衡量提示的性能。
    5. 设计初步提示:接下来,制作一个初步提示,概述任务定义、良好响应的特征以及Claude的任何必要上下文。理想情况下,您应该添加一些规范输入和输出的示例供Claude遵循。此初步提示将作为细化的起点。
    6. 针对测试用例的测试提示:使用初步提示将您的测试用例输入到Claude中。根据你的预期产出和成功标准仔细评估模型的反应。使用一致的评分准则,无论是人为评估、与答案的比较,还是克劳德基于准则的另一个判断实例。关键是要有一个系统的方法来评估绩效。
    7. 优化提示:根据步骤4的结果,反复优化提示,以提高测试用例的性能,更好地满足您的成功标准。这可能包括添加说明、示例或约束来指导Claude的行为。注意不要对一组狭窄的输入进行过度优化,因为这可能会导致过度拟合和泛化能力差。
    8. 发出完善的提示:一旦您收到在测试用例中表现良好并满足成功标准的提示,就可以在应用程序中部署它了。监控模型在野外的性能,并准备根据需要进行进一步的改进。边缘案例可能会突然出现,这是您最初测试集中没有预料到的。
      在整个过程中,值得从最有能力的模型和不受约束的提示长度开始,以建立性能上限。一旦达到了所需的输出质量,就可以根据需要尝试更短的提示或更小的模型等优化,以减少延迟和成本。

通过遵循这种测试驱动的方法,并提前仔细定义您的任务和成功标准,您将能够很好地利用Claude的力量来处理您的特定用例。如果您在设计健壮的测试用例和提示方面投入时间,您将在模型性能和可维护性方面获得好处。


及时的工程技术


在整个快速开发周期中,您可以使用一些技术来提高Claude的性能,例如:

  • 清晰直接:提供清晰的说明和背景来指导Claude的回应
  • 使用示例:在提示中包括示例,以说明所需的输出格式或样式
  • 给Claude一个角色:让Claude扮演一个特定的角色(比如专家的角色),以提高用例的性能
  • 使用XML标记:将XML标记合并到提示和响应的结构中以获得更清晰的信息
  • 链式提示:将复杂的任务划分为更小、可管理的步骤,以获得更好的结果
    让克劳德思考:鼓励循序渐进的思考,以提高克劳德的输出质量
  • 预填充Claude的回应:用几句话开始Claude回应,引导其输出朝着所需的方向发展
  • 控制输出格式:指定所需的输出格式以确保一致性和可读性
  • 要求Claude重写:请求基于准则的修订,以使Claude迭代并改进其输出
  • 长上下文窗口提示:利用Claude的长上下文窗口优化提示
    我们还提供了一个实验性的辅助元提示,提示Claude根据您提供的指导原则为您创建一个提示。元提示是实验性的,但可能有助于起草初始提示或快速创建许多提示变体进行测试。

注:Claude 3系列以上的型号可能需要更及时的工程设计。有关更多信息,请参阅我们的旧型号指南。


其他资源


要了解有关即时工程的更多信息,请查看以下资源:

  • Anthropic cookbook:一套Jupyter笔记本形式的食谱,其中包含可复制的代码,演示如何在更高级的场景中以各种整洁有效的方式使用Claude,如上传PDF、工具使用和函数调用、嵌入等
  • 提示工程交互式教程:一个动手的逐步教程,使其易于学习有效的提示策略(需要API键)
    如果您想查看示例解决方案,还有一个附带的答案键。
  • 提示库:为各种个人和专业用例的常见、有趣和有用的任务预先编写的提示集合
  • 客户端SDK:一组工具,使您更容易使用Claude进行构建并将其集成到应用程序中
本文地址
最后修改
星期四, 五月 16, 2024 - 20:01
Article