跳转到主要内容

热门内容

今日:

  • 【数据管理架构】Medallion架构和数据网格
  • 【SAP Leonardo】什么是SAP Leonardo?SAP Leonardo的工作原理。
  • 【数据治理框架】数据治理框架-示例、模板、标准、最佳实践&如何创建数据治理框架?
  • 【网络架构】什么是应用交付控制器(ADC)?
  • 【数据架构】TOGAF建模:数据发布图表
  • 【GAN架构】GAN与transformer模型:比较架构和用途
  • 【前端架构】Angular vs React vs Vue:哪一个是2021年的最佳选择
  • 【数字化供应链】CPRF:协作规划、预测和补充计划:最新进展
  • 【架构框架】ArchiMate视图指南(1):ArchiMate视图及基本视图概览
  • 【安全工具】ModSecurity性能的建议

总体:

  • 【数据集成】用于数据集成的10个最佳开源ETL工具
  • 【管理】热尔韦原理综述
  • 【Java框架】2022 年 17 个流行的 Java 框架:优缺点等
  • 【开源许可】从开源到免费和开源,MinIO现在在GNU AGPLv3许可
  • 【SAP】如何开始使用Sap AFS和Sap FMS。
  • 【数据目录】OpenMetadata与DataHub:比较架构、功能、集成等
  • 【数据治理】开源数据治理-2023年需要考虑的7个最佳工具
  • 【开源合规】使用MySQL许可:开源许可与商业许可
  • 【微服务架构】微服务已死——迷你服务万岁
  • 【SAP GUI】什么是SAP GUI(图形用户界面)以及如何使用它

最近浏览:

  • 【容器云】K3d vs k3s vs Kind vs Microk8s vs Minikube
  • 【Gen UI】生成式用户界面与结果导向设计的范式革命​
  • 【SCADA】监控和数据采集(SCADA)详述
  • 【安全工具】ModSecurity性能的建议
  • 【容器云】microk8s 介绍
  • 【架构框架】ArchiMate视图指南(1):ArchiMate视图及基本视图概览
  • [数据架构]ECM、DMS、DAM、CMS和FMS之间有什么区别?
  • 【数据治理框架】数据治理框架-示例、模板、标准、最佳实践&如何创建数据治理框架?
  • 【数据架构】TOGAF建模:数据发布图表
  • 【数据管理架构】Medallion架构和数据网格

热门内容

今日:

  • 【数据管理架构】Medallion架构和数据网格
  • 【隐私增强技术】隐私增强技术类型和使用案例
  • 【网络架构】什么是应用交付控制器(ADC)?
  • 【开源合规】开源软件许可证101:AGPL许可证
  • 【数据库架构】设置 PostgreSQL 多主复制:变得简单
  • 【数据治理框架】数据治理框架-示例、模板、标准、最佳实践&如何创建数据治理框架?
  • 【知识】DIKW(数据,信息,知识,智慧)金字塔
  • 【开源许可】从开源到免费和开源,MinIO现在在GNU AGPLv3许可
  • 【GAN架构】GAN与transformer模型:比较架构和用途
  • 「云转型」可证实的企业云转型战略

总体:

  • 语言和框架
  • 【容器架构】Minikube vs.kind vs.k3s-我应该用哪一个?
  • 【数据集成】用于数据集成的10个最佳开源ETL工具
  • 【Java框架】2022 年 17 个流行的 Java 框架:优缺点等
  • 【技术选型】Keras、TensorFlow和PyTorch的区别
  • 【深度学习】45测试深度学习基础知识的数据科学家的问题(以及解决方案)
  • 【数据架构】什么是实体关系图(ERD)?
  • 【Rust架构】Rust web框架比较
  • 【知识】DIKW(数据,信息,知识,智慧)金字塔
  • 【技术选型】AMQP vs MQTT

最近浏览:

  • [Microsoft Entra ID]Microsoft Entra ID中应用程序属性的安全最佳实践
  • 【Rust架构】Rust web框架比较
  • 【容器云】K3d vs k3s vs Kind vs Microk8s vs Minikube
  • 【Gen UI】生成式用户界面与结果导向设计的范式革命​
  • 【生成人工智能】什么是生成人工智能?你需要知道的一切
  • 【SCADA】监控和数据采集(SCADA)详述
  • 【安全工具】ModSecurity性能的建议
  • 【开源许可】从开源到免费和开源,MinIO现在在GNU AGPLv3许可
  • 【容器云】microk8s 介绍
  • 【数据分析】基于仿真的优化

首页
x

Main navigation

  • 主页
  • 数字化 +
    • 数字业务自动化
    • 数字化方案
    • 数字化转型战略
    • 数字化转型治理
    • 数字化运营
    • 数字化客户
      • 客户
    • 数字化研发
      • 研发
    • 数字化制造
    • 数字化生产
    • 数字化供应链
    • 数字化销售
    • 数字化服务
    • 数字化营销
      • 营销
    • 数字化财务
    • 人力资源
    • 数字化法务
  • 企业架构 +
    • 企业安全架构
    • 企业架构框架
    • 方案架构
  • 企业业务架构
  • 企业技术架构
  • 企业应用架构
  • 企业数据架构
  • 数据应用架构 +
    • 主数据架构
    • 大数据架构
    • 数据仓库架构
    • 数据保护
    • 数据库架构
    • 数据建模
    • 数据枢纽架构
    • 数据湖架构
    • 数据编制架构
    • 数据网格架构
    • 数据虚拟化架构
  • 集成架构 +
  • 架构质量 +
  • 软件架构 +
  • 大数据架构 +
    • Hadoop 生态
    • Saprk生态
    • 大数据战略
  • 数据和分析 +
    • 机器学习
    • 数据分析
    • 数据可视化
    • 数据工程
    • 数据战略
    • 数据挖掘
    • 数据科学
    • 商务智能
  • 数据库架构 +
    • MySql架构
    • PostgreSql架构
    • 云数据库
    • 内存数据库
    • 列式数据库
    • 图形数据库
    • 搜索引擎
    • 文档数据库
  • 数据治理
  • 数据管理 +
    • 数据仓库
    • 数据湖
  • 企业合规管理
  • 企业治理 +
  • 企业风险管理
  • 隐私保护
  • 智能转型 +
  • 云计算 +
    • AWS 平台
    • SaaS云
    • Salesforce
    • 云原生
    • 云架构
    • 云治理
    • 云转型战略
    • 容器云
    • 微软云
    • 私有云
  • 人工智能 +
  • 生成式人工智能 +
    • 多模态模型
    • 大视觉模型
    • 大语言模型
    • 大音频模型
  • 万物互联 +
    • 工业控制系统
    • 工业物联网
    • 物联网(IoT)安全
    • 物联网(IoT)架构
    • 物联网战略
    • 边缘计算
  • 元宇宙
  • 区块链 +
  • 安全 +
    • 云安全
    • 安全工具
    • 安全战略
    • 安全运营
    • 应用安全
    • 数据安全
    • 终端安全
    • 网络安全
    • 隐私保护
  • 基础设施 +
  • 软件开发 +
    • 开发管理
    • 需求分析
    • 低代码开发
  • 软件测试 +
  • 软件设计
  • DevOps +
  • 敏捷
  • 项目 +
  • 平台和工具 +
    • DevOps工具
    • 云计算平台
    • 企业事件枢纽
    • 其他工具
    • 分布式平台
    • 大数据平台
    • 应用中间件
    • 开发工具
    • 数据工具
    • 集成平台
  • 语言和框架 +
    • Go语言
    • Javascript开发
    • Java开发
    • Python开发
    • Rust语言
    • TypeScript开发
    • 前端技术和框架
    • 算法和数据结构
  • 硬件和设备 +
  • 产品 +
    • 产品管理
    • 产品设计
  • 技术 +
    • 技术趋势
    • 技术选型
  • 用户体验 +
  • IT管理 +
  • 商业 +
    • 商业模型
    • 商业管理
    • 商业结构
    • 商业计划
    • 商务沟通
    • 创业
      • 创业管理
    • 国际商务
    • 经济
  • 战略 +
  • 管理 +
  • 解决方案
  • 关注
  • 社区
  • 职业
  • 职业和职位 +
  • 咨询服务
  • 微软专栏

【Azure OpenAI】开始自定义大型语言模型(LLM)

  1. 首页 ⟶
  2. 【Azure OpenAI】开始自定义大型语言模型(LLM)
Chinese, Simplified
SEO Title
Azure OpenAI - Getting started with customizing a large language model (LLM)

category

  • 生成式AI

有几种技术可以调整预先训练的语言模型以适应特定的任务或领域。其中包括即时工程、RAG(Retrieval Augmented Generation)和微调。这三种技术并不相互排斥,而是互补的方法,结合起来可以应用于特定的用例。在本文中,我们将探讨这些技术、说明性用例、需要考虑的事项,并提供到资源的链接,以了解更多信息并开始使用每种技术。

提示工程


释义


提示工程是一种艺术和科学的技术,涉及为生成的人工智能模型设计提示。该过程利用了上下文学习(零次射门和少量射门),并通过迭代提高了响应的准确性和相关性,优化了模型的性能。

说明性用例


有环保意识的公司的营销经理可以使用即时工程来帮助指导模型生成更符合其品牌基调和风格的描述。例如,他们可以在输入中添加诸如“为一系列新的环保清洁产品编写产品描述,强调质量、有效性,并强调使用环保成分”之类的提示。这将有助于模型生成与其品牌价值观和信息一致的描述。

需要考虑的事项


即时工程是从生成的人工智能模型中生成所需输出的起点。

制作清晰的说明:说明通常用于提示和指导模型的行为。要具体,尽可能少留解释的余地。使用类比和描述性语言帮助模型理解您想要的结果。

实验和迭代:即时工程是一门需要实验和迭代的艺术。练习并获得为不同任务制作提示的经验。每个模型的行为可能不同,因此相应地调整及时的工程技术很重要。

开始

  • Introduction to prompt engineering
  • Prompt engineering techniques
  • 15 tips to become a better prompt engineer for generative AI
  • The basics of prompt engineering (video)


RAG(检索增强生成)


释义


RAG(Retrieval Augmented Generation,检索增强生成)是一种将外部数据集成到大型语言模型提示中以生成相关响应的方法。当使用基于不同主题的大型非结构化文本语料库时,这种方法尤其有益。它允许以组织的知识库(KB)为基础提供答案,从而提供更具针对性和准确性的响应。

当基于组织的私人数据回答问题时,或者当模型所训练的公共数据可能已经过时时,RAG也是有利的。这有助于确保响应始终是最新的和相关的,无论数据环境如何变化。

说明性用例


公司人力资源部门正在寻求提供一个智能助理,回答特定的员工健康保险相关问题,如“是否包括眼镜?”RAG用于获取与保险计划政策相关的大量文件,以回答这些特定类型的问题。

需要考虑的事项

  • RAG有助于将人工智能输出固定在真实世界的数据中,并降低制造的可能性。
  • 当需要回答基于私人专有数据的问题时,RAG很有帮助。
  • 当您可能想要回答最近的问题时(例如,在模型版本上次训练的截止日期之前),RAG非常有用。

开始

  • Retrieval Augmented Generation in Azure AI Studio - Azure AI Studio | Microsoft Learn
  • Retrieval Augmented Generation (RAG) in Azure AI Search
  • Retrieval Augmented Generation using Azure Machine Learning prompt flow (preview)
     

微调


释义


微调,特别是在这种情况下的监督微调,是一个迭代过程,它使现有的大型语言模型适应所提供的训练集,以提高性能、教授模型新技能或减少延迟。当模型需要学习和概括特定主题时,特别是当这些主题的范围通常很小时,会使用这种方法。

微调需要使用基于特殊示例的格式的高质量训练数据来创建新的微调大型语言模型。通过专注于特定主题,微调使模型能够在这些关注领域内提供更准确和相关的响应。

说明性用例


一个IT部门一直在使用GPT-4将自然语言查询转换为SQL,但他们发现响应并不总是可靠地基于他们的模式,而且成本高得令人望而却步。

他们用数百个请求和正确的响应对GPT-3.5-Turbo进行微调,并生成一个比基本模型性能更好、成本和延迟更低的模型。

需要考虑的事项


  • 微调是一种高级功能;它利用截止日期后的知识和/或领域特定知识来增强LLM。在考虑此选项之前,首先根据标准模型的要求评估其基线性能。
  • 有一个没有微调的性能基线对于了解微调是否提高了模型性能至关重要。使用坏数据进行微调会使基本模型变得更糟,但如果没有基线,则很难检测到回归。
  • 微调的好例子包括引导模型以特定和自定义的风格、音调或格式输出内容,或者引导模型所需的信息太长或太复杂而无法放入提示窗口的任务。
  • 微调成本:
    • 微调可以降低两个维度的成本:(1)根据任务使用更少的令牌;(2)使用更小的模型(例如,GPT 3.5 Turbo可能会进行微调,以在特定任务上实现与GPT-4相同的质量)。
    • 微调会产生培训模型的前期成本。以及部署自定义模型后托管该模型的额外小时成本。

开始


  • When to use Azure OpenAI fine-tuning
  • Customize a model with fine-tuning
  • Azure OpenAI GPT 3.5 Turbo fine-tuning tutorial
  • To fine-tune or not to fine-tune? (Video)
 
 

本文地址
https://architect.pub
  • 登录 发表评论
  • 9 次浏览
发布日期
星期四, 七月 4, 2024 - 10:51
最后修改
星期四, 七月 4, 2024 - 10:51

Tags

  • 大型语言模型
  • Azure
  • Azure AI
  • 人工智能
  • 生成式AI
Article
Read more

最新内容

  • 【DeepSeek】如何为自定义数据集微调DeepSeek-R1(一步一步)
    3 days 12 hours ago
  • 【UI开发】为AI应用程序构建UI的3个最佳Python框架
    1 week 4 days ago
  • 【前端开发】🚀🔥 改变编码方式的10个前端开发AI助手
    1 week 5 days ago
  • 【前端开发】生成式AI革新前端开发:传统开发模式的颠覆
    1 week 5 days ago
  • 【CNN架构】解释不同类型的CNN架构:示例
    1 week 5 days ago
  • 【信息设计】设计模式指南:学习指南
    1 week 5 days ago
  • 【设计思维】什么是设计思维?
    1 week 5 days ago
  • 【Gen UI】生成式用户界面与结果导向设计的范式革命​
    1 month ago
  • 测试Bolt.new:开发者亲测AI应用构建工具​
    1 month ago
  • 生成式用户界面(Gen UI)是什么?它重要吗?
    1 month ago

网站备案号:京ICP备2022026098号-2

友情链接

  • CPO宝典
  • 全球IT瞭望
  • 开发者开聊
  • 智能化转型智库
  • 架构师研究会

知识星球

知识星球:首席架构师圈

 

抖音直播

抖音:cea_cio(超级架构师)
干货直播,干货分享

 

微信小号

超级架构师
超级架构师小号:加群,私聊

 

微信公众号

超级架构师公众号

 

QQ群:超级架构师

QQ Group

Tags

Tags

  • 大型语言模型
  • Azure
  • Azure AI
  • 人工智能
  • 生成式AI
© 2025 架构师研究会, All rights reserved.
↑