【生成人工智能】什么是生成人工智能？你需要知道的一切 |

语言 Chinese, Simplified

SEO Title

What is generative AI? Everything you need to know

生成人工智能是一种人工智能技术，可以生成各种类型的内容，包括文本、图像、音频和合成数据。最近围绕生成人工智能的热潮是由新用户界面的简单性推动的，这些界面可以在几秒钟内创建高质量的文本、图形和视频。

应该指出的是，这项技术并不是全新的。生成人工智能于20世纪60年代在聊天机器人中引入。但直到2014年，随着生成对抗性网络（GANs）——一种机器学习算法——的引入，生成人工智能才能够创造出令人信服的真实真人图像、视频和音频。

一方面，这种新发现的能力带来了机会，包括更好的电影配音和丰富的教育内容。它还释放了人们对deepfakes（数字伪造的图像或视频）和对企业的有害网络安全攻击的担忧，包括真实模仿员工老板的邪恶请求。

下面将更详细地讨论的另外两个最新进展在生成人工智能成为主流方面发挥了关键作用：转换器和它们所实现的突破性语言模型。变形金刚是一种机器学习，它使研究人员可以训练更大的模型，而不必预先标记所有数据。因此，新的模型可以在数十亿页的文本上进行训练，从而得到更深入的答案。此外，transformers解锁了一个名为注意力的新概念，使模型能够跟踪页面、章节和书籍中单词之间的联系，而不仅仅是单个句子中的联系。不仅仅是文字：变形金刚还可以利用它们追踪连接的能力来分析代码、蛋白质、化学物质和DNA。

所谓的大型语言模型（LLM）——即具有数十亿甚至数万亿参数的模型——的快速发展开启了一个新时代，在这个时代，生成性人工智能模型可以书写引人入胜的文本，绘制逼真的图像，甚至可以在飞行中创作一些有趣的情景喜剧。此外，多模式人工智能的创新使团队能够在多种类型的媒体上生成内容，包括文本、图形和视频。这是Dall-E等工具的基础，这些工具可以根据文本描述自动创建图像或根据图像生成文本字幕。

尽管取得了这些突破，但我们仍处于使用生成人工智能创建可读文本和逼真风格化图形的早期阶段。早期的实现存在准确性和偏见问题，并且容易产生幻觉和吐出奇怪的答案。尽管如此，迄今为止的进展表明，这类人工智能的固有能力可能会从根本上改变业务。展望未来，这项技术可以帮助编写代码、设计新药、开发产品、重新设计业务流程和转变供应链。

Timeline of the history of generative AI technologies

生成人工智能是如何工作的？

生成人工智能从一个提示开始，该提示可以是文本、图像、视频、设计、音符或人工智能系统可以处理的任何输入。然后，各种人工智能算法会根据提示返回新内容。内容可以包括文章、问题的解决方案，或者根据一个人的图片或音频制作的逼真赝品。

早期版本的生成性人工智能要求通过API或其他复杂的过程提交数据。开发人员必须熟悉特殊工具，并使用Python等语言编写应用程序。

现在，生成人工智能的先驱们正在开发更好的用户体验，让你用通俗易懂的语言描述请求。在最初的响应之后，您还可以自定义结果，并提供有关风格、语气和其他元素的反馈，以反映生成的内容。

Image displaying quotes about generative AI from industry experts

生成型人工智能模型

生成型人工智能模型结合了各种人工智能算法来表示和处理内容。例如，为了生成文本，各种自然语言处理技术将原始字符（例如，字母、标点符号和单词）转换为句子、词性、实体和动作，使用多种编码技术将其表示为向量。类似地，图像被转换成各种视觉元素，也被表示为向量。一个警告是，这些技术也可能对训练数据中包含的偏见、种族主义、欺骗和夸大进行编码。

一旦开发人员确定了一种表示世界的方式，他们就会应用特定的神经网络来生成新的内容，以响应查询或提示。GAN和变分自动编码器（VAE）等技术——具有解码器和编码器的神经网络——适用于生成逼真的人脸、用于人工智能训练的合成数据，甚至特定人类的传真。

转换器的最新进展，如谷歌的双向编码器转换器表示（BERT）、OpenAI的GPT和谷歌AlphaFold，也产生了不仅可以编码语言、图像和蛋白质，还可以生成新内容的神经网络。

神经网络如何改变生成型人工智能

自人工智能诞生之初，研究人员就一直在创建人工智能和其他工具，以编程方式生成内容。最早的方法被称为基于规则的系统，后来被称为“专家系统”，使用明确制定的规则来生成响应或数据集。

神经网络是当今许多人工智能和机器学习应用的基础，它扭转了这个问题。神经网络旨在模仿人脑的工作方式，通过在现有数据集中寻找模式来“学习”规则。第一批神经网络开发于20世纪50年代和60年代，由于缺乏计算能力和数据集小而受到限制。直到2000年代中期大数据的出现和计算机硬件的改进，神经网络才成为生成内容的实用工具。

当研究人员找到一种方法，让神经网络在计算机游戏行业用于渲染视频游戏的图形处理单元（GPU）上并行运行时，这一领域加速了发展。过去十年中开发的新机器学习技术，包括上述生成对抗性网络和转换器，为人工智能生成内容的最新显著进步奠定了基础。

Dall-E、ChatGPT和Bard是什么？

ChatGPT、Dall-E和Bard是流行的生成人工智能接口。

Dall-E.

Dall-E经过大量图像数据集及其相关文本描述的训练，是一个多模式人工智能应用程序的例子，该应用程序可以识别视觉、文本和音频等多种媒体之间的连接。在这种情况下，它将单词的含义与视觉元素联系起来。它是在2021年使用OpenAI的GPT实现构建的。Dall-E2是第二个功能更强的版本，于2022年发布。它使用户能够在用户提示的驱动下生成多种风格的图像。

ChatGPT

2022年11月席卷全球的人工智能聊天机器人是建立在OpenAI的GPT-3.5实现之上的。OpenAI提供了一种通过具有交互式反馈的聊天界面进行交互和微调文本响应的方法。早期版本的GPT只能通过API访问。GPT-4于2023年3月14日发布。ChatGPT将其与用户的对话历史记录纳入其结果中，模拟真实的对话。在新的GPT界面大受欢迎后，微软宣布对OpenAI进行重大新投资，并将GPT的一个版本集成到其Bing搜索引擎中。

Image shows two checklists comparing the features of ChatGPT vs. Bard

Here is a snapshot of the differences between ChatGPT and Bard.

Bard

谷歌是另一个早期的领导者，在处理语言、蛋白质和其他类型的内容方面开创了变压器人工智能技术。它为研究人员开放了其中一些模型。然而，它从未为这些模型发布过公共界面。微软决定在必应中实现GPT，这促使谷歌急于推出一款面向公众的聊天机器人Google Bard，该机器人基于其大型语言模型LaMDA家族的轻量级版本。在巴德匆忙亮相后，谷歌股价大幅下跌，因为语言模型错误地说韦布望远镜是第一个在外国太阳系中发现行星的望远镜。与此同时，由于不准确的结果和不稳定的行为，微软和ChatGPT的实现在早期也失去了面子。此后，谷歌推出了基于其最先进的LLM PaLM 2的新版Bard，该LLM使Bard在响应用户查询时更加高效和可视化。

生成人工智能的用例是什么？

生成型人工智能可以应用于各种用例，以生成几乎任何类型的内容。由于GPT等可以针对不同应用进行调整的尖端突破，这项技术越来越容易被各种用户使用。生成人工智能的一些用例包括以下内容：

为客户服务和技术支持实施聊天机器人。
部署deepfakes来模仿人们甚至特定的个人。
改进不同语言的电影和教育内容的配音。
撰写电子邮件回复、约会简介、简历和学期论文。
以一种特殊的风格创作逼真的艺术作品。
改进产品演示视频。
建议测试新药化合物。
设计实体产品和建筑。
优化新芯片设计。
以特定的风格或音调创作音乐。

https://youtu.be/1U83yhGY_pI

生成人工智能的好处是什么？

生成型人工智能可以广泛应用于商业的许多领域。它可以更容易地解释和理解现有内容，并自动创建新内容。开发人员正在探索生成人工智能可以改进现有工作流程的方法，以期完全适应工作流程，从而利用这项技术。实施生成人工智能的一些潜在好处包括以下方面：

自动化手动编写内容的过程。
减少回复电子邮件的工作量。
改进对具体技术问题的回应。
创造真实的人物形象。
把复杂的信息总结成连贯的叙述。
简化以特定样式创建内容的过程。

生成人工智能的局限性是什么？

生成人工智能的早期实现生动地说明了它的许多局限性。生成人工智能提出的一些挑战来自于用于实现特定用例的特定方法。例如，一个复杂主题的摘要比包含支持关键点的各种来源的解释更容易阅读。然而，摘要的可读性是以用户能够审查信息来源为代价的。

以下是在实现或使用生成型人工智能应用程序时需要考虑的一些限制：

它并不总是识别内容的来源。
评估原始来源的偏差可能具有挑战性。
听起来真实的内容使识别不准确的信息变得更加困难。
很难理解如何适应新的环境。
结果可以掩盖偏见、偏见和仇恨。

注意是你所需要的：变压器带来了新的功能

2017年，谷歌报告了一种新型神经网络架构，该架构显著提高了自然语言处理等任务的效率和准确性。这种突破性的方法被称为变形金刚，是基于注意力的概念。

在高层次上，注意力是指事物（如单词）如何相互关联、互补和修饰的数学描述。研究人员在他们的开创性论文《注意力就是你所需要的一切》中描述了这种架构，展示了变压器神经网络如何能够比其他神经网络更准确地在英语和法语之间进行翻译，并且只需四分之一的训练时间。这项突破性的技术还可以发现数据中隐藏的其他事物之间的关系或隐藏顺序，而这些事物可能由于过于复杂而无法表达或辨别，因此人类可能并不知道。

Transformer架构自推出以来发展迅速，产生了GPT-3等LLM和谷歌的BERT等更好的预训练技术。

围绕生成人工智能的担忧是什么？

生成人工智能的兴起也引发了各种各样的担忧。这些与结果的质量、滥用和滥用的可能性以及破坏现有商业模式的可能性有关。以下是生成人工智能的现状所带来的一些具体类型的问题：

它可能提供不准确和误导性的信息。
如果不知道信息的来源和出处，就更难信任。
它可能会助长无视内容创作者和原创内容艺术家权利的新型抄袭行为。
它可能会破坏围绕搜索引擎优化和广告构建的现有商业模式。
这使得产生假新闻变得更加容易。
这使得人们更容易声称不法行为的真实照片证据只是人工智能生成的赝品。
它可以模仿人们进行更有效的社会工程网络攻击。

Implementing generative AI is not just about technology. Businesses must also consider its impact on people and processes.

生成人工智能工具的一些例子是什么？

生成人工智能工具适用于各种形式，如文本、图像、音乐、代码和语音。一些流行的人工智能内容生成器包括以下内容：

文本生成工具包括GPT、Jasper、AI Writer和Lex。
图像生成工具包括Dall-E2、Midjourney 和Stable Diffusion。
音乐生成工具包括Amper、Dadabots和MuseNet。
代码生成工具包括CodeStarter、Codex、GitHub Copilot和Tabnine。
语音合成工具包括Descriptt、Listnr和Podcast.ai。
人工智能芯片设计工具公司包括Synopsys、Cadence、谷歌和英伟达。

按行业划分的生成人工智能用例

新的生成性人工智能技术有时被描述为类似于蒸汽动力、电力和计算的通用技术，因为它们可以深刻影响许多行业和用例。必须记住的是，与以前的通用技术一样，人们通常需要几十年的时间才能找到组织工作流的最佳方式，以利用新方法，而不是加快现有工作流的一小部分。以下是生成型人工智能应用可能影响不同行业的一些方式：

金融可以在个人历史的背景下观察交易，以建立更好的欺诈检测系统。
律师事务所可以使用生成人工智能来设计和解释合同、分析证据和提出论点。
制造商可以使用生成人工智能将摄像头、X射线和其他指标的数据结合起来，更准确、更经济地识别缺陷零件和根本原因。
电影和媒体公司可以使用生成人工智能更经济地制作内容，并用演员自己的声音将其翻译成其他语言。
医疗行业可以使用生成人工智能更有效地识别有前景的候选药物。
建筑公司可以使用生成人工智能更快地设计和调整原型。
游戏公司可以使用生成人工智能来设计游戏内容和关卡。

GPT加入通用技术的万神殿

人工智能研究和部署公司OpenAI采用了Transformer背后的核心思想来训练其版本，称为Generative Pre-trained Transformer或GPT。观察人士注意到，GPT是用于描述蒸汽机、电力和计算等通用技术的首字母缩写。大多数人都同意，随着研究人员发现将GPT和其他转换器应用于工业、科学、商业、建筑和医学的方法，GPT和其它转换器实现已经名副其实。

生成人工智能中的伦理与偏见

尽管他们做出了承诺，但新的生成人工智能工具在准确性、可信度、偏见、幻觉和剽窃方面打开了一个漏洞——这些伦理问题可能需要数年时间才能解决。这些问题对人工智能来说都不是什么新鲜事。例如，微软2016年首次进军聊天机器人Tay，在推特上开始发表煽动性言论后，不得不关闭。

新的是，最新一批生成型人工智能应用程序表面上听起来更连贯。但这种类人语言和连贯性的结合并不是人类智能的同义词，目前关于生成人工智能模型是否可以被训练成具有推理能力存在很大争议。一位谷歌工程师甚至在公开宣布该公司的生成人工智能应用程序对话应用程序语言模型（LaMDA）具有感知能力后被解雇。

生成人工智能内容令人信服的现实主义引入了一系列新的人工智能风险。它使检测人工智能生成的内容变得更加困难，更重要的是，使检测错误变得更加困难。当我们依赖生成的人工智能结果来编写代码或提供医疗建议时，这可能是一个大问题。生成人工智能的许多结果都是不透明的，因此很难确定它们是否侵犯了版权，或者它们得出结果的原始来源是否存在问题。如果你不知道人工智能是如何得出结论的，你就无法解释为什么它可能是错误的。

生成型人工智能与人工智能

生成人工智能生成新内容、聊天响应、设计、合成数据或深度伪造。另一方面，传统的人工智能专注于检测模式、做出决策、完善分析、对数据进行分类和检测欺诈。

如上所述，生成型人工智能通常使用变压器、GANs和VAE等神经网络技术。不同的是，其他类型的人工智能使用的技术包括卷积神经网络、递归神经网络和强化学习。

生成型人工智能通常以提示开始，允许用户或数据源提交开始查询或数据集来指导内容生成。这可能是一个探索内容变化的迭代过程。传统的人工智能算法处理新数据以返回简单的结果。

生成型人工智能能历史

Joseph Weizenbaum在20世纪60年代创建的Eliza聊天机器人是生成人工智能最早的例子之一。这些早期的实现使用了基于规则的方法，由于词汇有限、缺乏上下文和过度依赖模式等缺点，这种方法很容易被打破。早期的聊天机器人也很难定制和扩展。

2010年，随着神经网络和深度学习的进步，该领域出现了复兴，使该技术能够自动学习解析现有文本、分类图像元素和转录音频。

Ian Goodfellow于2014年引入了GANs。这种深度学习技术为组织竞争性神经网络生成内容变化并对其进行评级提供了一种新的方法。这些可以产生逼真的人物、声音、音乐和文本。这激发了人们对如何利用生成性人工智能创建逼真的deepfakes的兴趣和恐惧，这些deepfake模仿视频中的声音和人。

从那时起，其他神经网络技术和架构的进步有助于扩展生成人工智能的能力。技术包括VAE、长短期记忆、变换器、扩散模型和神经辐射场。

使用生成人工智能的最佳实践

使用生成人工智能的最佳实践将因模式、工作流程和期望目标而异。也就是说，在使用生成人工智能时，考虑准确性、透明度和易用性等基本因素很重要。以下实践有助于实现这些因素：

为用户和消费者清楚地标注所有生成的人工智能内容。
在适用的情况下，使用主要来源审查生成内容的准确性。
考虑一下偏见如何融入生成的人工智能结果中。
使用其他工具仔细检查人工智能生成的代码和内容的质量。
了解每种生成人工智能工具的优势和局限性。
熟悉结果中常见的失败模式，并解决这些问题。

生成人工智能的未来

ChatGPT令人难以置信的深度和易用性为生成人工智能的广泛采用显示了巨大的前景。可以肯定的是，它也表明了安全和负责任地推出这项技术的一些困难。但这些早期的实现问题激发了人们对检测人工智能生成的文本、图像和视频的更好工具的研究。工业和社会还将建立更好的工具来追踪信息的来源，以创造更值得信赖的人工智能。

此外，人工智能开发平台的改进将有助于加快未来文本、图像、视频、3D内容、药品、供应链、物流和商业流程等更好的生成人工智能能力的研发。尽管这些新的一次性工具很好，但生成人工智能最重要的影响将来自于将这些功能直接嵌入我们已经使用的工具版本中。

语法检查会越来越好。设计工具将把更有用的建议无缝地直接嵌入到工作流程中。培训工具将能够自动识别组织某一部门的最佳做法，以帮助更有效地培训其他部门。这些只是生成人工智能改变我们工作方式的一小部分。

Image listing various business benefits of generative AI

Generative AI will find its way into many business functions.

生成AI常见问题

以下是人们对生成人工智能的一些常见问题。

谁创造了生成人工智能？

Joseph Weizenbaum在20世纪60年代创建了第一个生成人工智能，作为Eliza聊天机器人的一部分。

伊恩·古德费罗在2014年展示了生成对抗性网络，用于生成长相和声音逼真的人。

随后，Open AI和谷歌对LLM的研究点燃了最近的热情，并发展成为ChatGPT、Google Bard和Dall-E等工具。

生成人工智能如何取代工作？

生成型人工智能有潜力取代各种工作，包括以下工作：

编写产品说明。
正在创建市场营销副本。
正在生成基本web内容。
发起互动式销售推广。
回答客户的问题。
为网页制作图形。

一些公司将在可能的情况下寻找替代人类的机会，而另一些公司将使用生成人工智能来增加和增强现有的劳动力。

你如何建立一个生成的人工智能模型？

生成人工智能模型首先要有效地编码您想要生成的内容的表示。例如，文本的生成人工智能模型可能首先找到一种方法，将单词表示为向量，以表征同一句子中经常使用的单词或意思相似的单词之间的相似性。

LLM研究的最新进展帮助该行业实施了同样的过程来表示图像、声音、蛋白质、DNA、药物和3D设计中的模式。这种生成人工智能模型提供了一种有效的方式来表示所需类型的内容，并有效地迭代有用的变体。

如何训练生成人工智能模型？

生成人工智能模型需要针对特定的用例进行训练。LLM的最新进展为针对不同用例定制应用程序提供了一个理想的起点。例如，OpenAI开发的流行GPT模型已被用于根据书面描述编写文本、生成代码和创建图像。

训练包括针对不同的用例调整模型的参数，然后在给定的训练数据集上微调结果。例如，呼叫中心可能会针对服务代理从各种客户类型中获得的各种问题以及服务代理作为回报给出的回答来训练聊天机器人。与文本不同，图像生成应用程序可能从描述图像内容和风格的标签开始，以训练模型生成新图像。

生成人工智能如何改变创造性工作？

生成型人工智能有望帮助创造性工作者探索各种想法。艺术家可以从一个基本的设计概念开始，然后探索变化。工业设计师可以探索产品的变化。建筑师可以探索不同的建筑布局，并将其视为进一步完善的起点。

它还可以帮助创造性工作的某些方面民主化。例如，商业用户可以使用文本描述来探索产品营销图像。他们可以使用简单的命令或建议来进一步完善这些结果。

生成人工智能的下一步是什么？

ChatGPT生成类人文本的能力引发了人们对生成人工智能潜力的广泛好奇。它还揭示了未来的许多问题和挑战。

短期内，工作将侧重于使用生成人工智能工具改善用户体验和工作流程。建立对人工智能生成结果的信任也是至关重要的。

许多公司还将根据自己的数据定制生成人工智能，以帮助改善品牌和沟通。编程团队将使用生成人工智能来执行公司特定的最佳实践，以编写和格式化更可读、更一致的代码。

供应商将把生成人工智能功能集成到他们的附加工具中，以简化内容生成工作流程。这将推动这些新功能如何提高生产力的创新。

作为增强分析工作流程的一部分，生成人工智能还可以在数据处理、转换、标记和审查的各个方面发挥作用。语义网络应用程序可以使用生成人工智能自动将描述工作技能的内部分类法映射到技能培训和招聘网站上的不同分类法。同样，业务团队将使用这些模型转换和标记第三方数据，以实现更复杂的风险评估和机会分析功能。

未来，生成人工智能模型将扩展到支持3D建模、产品设计、药物开发、数字孪生、供应链和业务流程。这将使产生新的产品想法、尝试不同的组织模式和探索各种商业想法变得更容易。

定义了最新生成式人工智能技术

AI艺术（人工智能艺术）

人工智能艺术是用人工智能工具创造或增强的任何形式的数字艺术。阅读更多

自动GPT

Auto GPT是一种基于GPT-4语言模型的实验性开源自主人工智能代理，它自动将任务链接在一起，以实现用户设定的全局目标。阅读更多

谷歌搜索生成体验

谷歌搜索生成体验（SGE）是一套搜索和界面功能，将生成的人工智能结果集成到谷歌搜索引擎查询响应中。阅读更多

增强学习

Q学习是一种机器学习方法，它使模型能够通过采取正确的行动随着时间的推移迭代学习和改进。阅读更多

谷歌搜索实验室（GSE）

GSE是Alphabet旗下谷歌部门的一项举措，旨在在谷歌搜索公开之前，以预览形式为其提供新的功能和实验。阅读更多

Inception score

初始得分（IS）是一种数学算法，用于测量或确定生成人工智能通过生成对抗性网络（GAN）创建的图像的质量。“开端”一词指的是人类传统上经历的创造力的火花或思想或行动的最初开端。阅读更多

从人类反馈中强化学习（RLHF）

RLHF是一种机器学习方法，它将强化学习技术（如奖励和比较）与人类指导相结合，以训练人工智能代理。阅读更多

可变自动编码器（VAE）

变分自动编码器是一种生成人工智能算法，使用深度学习生成新内容、检测异常和去除噪声。阅读更多

自然语言处理的一些生成模型是什么？

一些用于自然语言处理的生成模型包括以下内容：

卡内基梅隆大学XLNet
OpenAI的GPT（Generative Pre-trained Transformer）
谷歌的ALBERT（“精简版”BERT）
谷歌BERT
谷歌LaMDA

人工智能会获得意识吗？

一些人工智能支持者认为，生成人工智能是迈向通用人工智能甚至意识的重要一步。谷歌LaMDA聊天机器人的一位早期测试者甚至在公开宣称它有感知能力时引起了轰动。然后他被公司解雇了。

1993年，美国科幻作家和计算机科学家Vernor Vinge提出，30年后，我们将有技术能力创造出“超人的智能”——一种比人类更智能的人工智能——之后人类时代将结束。人工智能先驱Ray Kurzweil预测到2045年会出现这样的“奇点”。

许多其他人工智能专家认为这可能会更进一步。机器人先驱罗德尼·布鲁克斯预测，人工智能在他有生之年不会获得6岁孩子的感知能力，但到2048年，它可能会像狗一样聪明和专注。

热门内容

今日:

总体:

最近浏览：