你听过这些AI术语却装懂?现在补课还不晚

编者按: 这不仅仅是一份AI术语表,它是一张通往未来的地图。当人工智能以雷鸣般的速度重塑世界时,一种全新的科技语言也随之诞生——LLM、RAG、RLHF……这些缩写让硅谷精英都感到窘迫。我们整理这本”活词典”,旨在将高冷的技术黑话翻译成人人能懂的大白话。它承载着AI浪潮的脉搏,如同一面棱镜,折射出从蒸馏到幻觉、从AGI到并行计算的理性光芒。那些听起来像科幻的概念,其实正悄然潜入你的日常。现在,就让我们撕开这些术语的神秘面纱,直面一个正在进化的智能时代。— AGI人工通用智能(AGI),这是一个模糊的定义,但一般指在多数甚至几乎所有任务上,比普通人更厉害的AI。OpenAI 首席执行官 Sam Altman 曾把它称为“你可以雇来当同事的中等人类”。而 OpenAI 的章程则将其定义为“在大多数有经济价值的工作中超越人类的高度自主系统”。谷歌 DeepMind 的理解与前两者又略有不同——他们认为 AGI 是“在大多数认知任务上至少与人类一样强的AI”。搞晕了吗?别担心——处于 AI 研究前沿的专家们也一头雾水。 AI Agent AI Agent(智能体)是一种借助AI技术替你执行复杂任务的工具,远超基础AI聊天机器人的能力,比如报销费用、订票、订位,甚至编写和维护代码。但我们之前解释过,这个新兴领域包含众多变量,因此“AI Agent”对不同人可能有不同含义。实现其构想的底层基础设施也还在建设之中。不过,基本概念指的是一种能调用多个AI系统,完成多步骤任务的自主系统。 API 端点 可以把 API 端点想象成软件背面的一排“按钮”,其他程序可以按这些按钮来让软件干活。开发者利用这些接口搭建集成——比如让一个应用从另一个拉取数据,或让AI Agent直接操控第三方服务,无需人手操作。多数智能家居设备和联网平台都藏着这些按钮,只不过普通用户看不见也用不上。随着AI Agent越来越强,它们能自主找到并调用这些端点,开启了强大且有时出乎意料的自动化可能。 思维链 对于简单问题,人脑甚至不用多想就能回答——比如“长颈鹿和猫,哪个高?”但有的时候,你需要纸笔才能得出正确答案,因为中间步骤太多。例如,一个农夫有鸡和牛,总共40个头和120条腿,你可能得列个方程才算出答案(20只鸡和20头牛)。 在AI语境中,大语言模型使用“思维链”推理意味着把问题拆解成更小、更中间的小步,以提升最终结果的质量。这样虽然耗时更长,但答案更可能正确,尤其在逻辑和编码场景里。拥有推理能力的模型是从传统大语言模型发展而来,通过强化学习专门优化了思维链思考模式。 (参见:大语言模型) 编码Agent 这是比“AI Agent”更具体的概念,指能自主逐步行动完成目标的程序。编码Agent则专用于软件开发:它不仅能建议代码让人工审核粘贴,还能独立写代码、测试、调试,处理那些通常占满开发者一天时间的迭代试错工作。这些Agent能扫描整个代码库,发现bug、运行测试、推送修复,只需少量人工监督。就像雇了一个超级快、不睡觉、从不分心的实习生——但和所有实习生一样,最终还得有人检查作业。 算力 虽然有多重含义,但“算力”通常指让AI模型运转的关键计算能力。这种处理能力为AI产业注入燃料,使其能够训练和部署强大模型。它往往是一种简称,特指背后的硬件:GPU、CPU、TPU以及构成现代AI产业基石的其他基础设施。 深度学习 这是自我改进型机器学习的一个子集,其中的AI算法采用多层人工神经网络(ANN)结构,从而比线性模型或决策树等更简单的机器学习系统能建立更复杂的关联。深度学习算法的结构模仿了人脑中相互连接的神经元路径。 深度学习AI模型能自己识别数据中重要特征,而不需要工程师手工定义。这种结构还支持算法通过重复和调整从错误中学习,不断改进输出。但深度学习系统需要大量数据点(数百万甚至更多)才能出好结果,训练周期也通常比简单算法更长,因此开发成本更高。 (参见:神经网络) 扩散 扩散是许多图像、音乐和文本生成AI模型的核心技术。灵感来自物理:扩散系统通过添加噪声,“缓慢破坏”数据(照片、歌曲等)的结构,直到什么都不剩。在物理学中,扩散是自发且不可逆的——溶进咖啡的糖无法恢复成方糖。但AI的扩散系统则试图学习一种“逆扩散”过程来恢复被破坏的数据,从而获得从噪声中还原数据的能力。 蒸馏 蒸馏是一种通过“教师-学生”模型从大AI模型中提取知识的技术。开发者向教师模型发送请求并记录输出,有时会与数据集比对准确度。这些输出被用来训练学生模型,使其近似教师的行为。 通过最小的蒸馏损失,蒸馏可以基于大模型创建更小、更高效的模型。这就是 OpenAI 开发 GPT‑4 Turbo(GPT‑4 的加速版)可能采用的方式。 所有AI公司都在内部使用蒸馏,但也有一些公司用它追赶前沿模型。从竞争对手那里蒸馏通常违反了AI API和聊天助手的服务条款。 微调 微调指在原有训练基础上,进一步训练AI模型以优化其在更特定任务或领域的表现——通常是通过喂入新的、专门的数据。 许多AI初创公司以大语言模型为起点构建商业产品,通过结合自身领域知识进行微调,来补上早期训练周期,以提升目标领域的实用性。 (参见:大语言模型 [LLM]) 生成对抗网络 GAN(生成对抗网络)是一种机器学习框架,在生成真实数据的生成式AI领域(尤其是深度伪造工具)中至关重要。GAN 使用一对神经网络:一个基于训练数据生成输出,传递给另一个模型进行评判。 这两个模型被编程为相互竞争:生成器试图骗过判别器,而判别器则在努力识别人造数据。这种结构化竞赛能在无需人工干预的情况下,优化AI的输出,使其更逼真。不过,GAN 更适合窄应用(如生成真实照片或视频),而非通用AI。 幻觉 幻觉是AI行业对AI“信口开河”的专属说法——即生成错误信息。这显然是AI质量的大问题。 幻觉使生成式AI输出具有误导性,甚至可能带来现实风险(比如一条健康查询竟返回有害医疗建议)。 人们认为,AI编造信息的问题源于训练数据的缺口。幻觉正推动AI向更专业或垂直化(即领域专属AI)方向发展,以缩小知识缺口、降低虚假信息风险。 推理 推理是运行AI模型的过程:让模型根据已有数据做出预测或得出结论。需要明确的是,推理离不开训练;模型必须先学习数据中的模式,才能有效地从训练数据中推导出新结果。 许多硬件都能进行推理:从手机处理器到强劲的GPU,再到定制设计的AI加速器。但并非所有硬件都能同样出色地运行模型。非常大的模型可能在笔记本上要花很长时间才能做出预测,而在配备高端AI芯片的云端服务器上则快得多。 [参见:训练] 大语言模型 (LLM) 大语言模型(LLM)是 ChatGPT、Claude、谷歌 Gemini、Meta AI Llama、微软 Copilot 和 Mistral Le Chat 等流行AI“助手”使用的AI模型。当你与AI助手聊天时,你就是在与一个直接处理你请求或借助各种工具(如网页浏览、代码解释器)的大型语言模型交互。 LLM 是由数十亿的数值参数(或称权重,见后文)构成的深度神经网络,它学习词语和短语之间的关系,创建一种语言表征——一个多维的词语地图。 这些模型通过对数十亿册图书、文章和录音的编码模式而诞生。当你给LLM一个提示,模型就会生成最符合提示的模式。 (参见:神经网络) 内存缓存 内存缓存是一种加速推理的重要过程(推理是AI生成用户响应的工作流程)。本质上,缓存是一种优化技术,旨在让推理更高效。AI 显然依赖高强度的数学计算,而每次计算都会消耗更多能量。缓存通过保存特定计算结果以供未来的查询和操作使用,从而减少模型必须运行的计算次数。内存缓存有不同的种类,其中最知名的是 KV(键值)缓存。KV 缓存用于基于 Transformer 的模型,通过减少生成答案所需的时间(和算法劳动)来提高效率,加快结果输出。 (参见:推理) 神经网络 神经网络是深度学习的基础——也是大语言模型出现后整个生成式AI工具热潮的根本。 尽管早在20世纪40年代,人们就有了模仿人脑密集连接路径来设计数据处理算法的想法,但真正实现这个理论的是最近通过视频游戏业崛起的图形处理硬件(GPU)。这些芯片非常适合训练层数比以前多得多的算法——这使得基于神经网络的AI系统在语音识别、自主导航和药物发现等多个领域实现了巨大性能飞跃。 (参见:大语言模型 [LLM]) 开源 开源指软件——或越来越多的AI模型——其底层代码公开,供任何人使用、检查或修改。在AI界,Meta 的 Llama 系列模型是典型例子;操作系统方面,Linux 是著名的历史对照。开源方法让世界各地的研究人员、开发者和公司可以相互构建,加速进步,并实现闭源系统难以提供的独立安全审计。闭源意味着代码私有——你可以使用产品但无法窥其原理,正如 OpenAI 的 GPT 模型——这一区别已成为AI行业最具决定性的争论之一。 并行化 并行化意味着同时做多件事,而不是一件接一件——好比10个员工同时处理项目的不同部分,而不是一个员工顺序干活。在AI中,并行化对训练和推理都至关重要:现代GPU专门设计为同时执行数千次计算,这是它们成为行业硬件基础的重要原因。随着AI系统越来越复杂、模型越来越大,跨多芯片和多机器并行工作的能力,已成为决定模型构建和部署速度及成本效益的最重要因素之一。对更好并行化策略的研究,现已自成独立领域。 内存末日 RAMageddon 是形容一个横扫科技行业的不妙趋势的新颖说法:随机存取内存(RAM)芯片持续短缺。RAM 为我们日常使用的几乎所有科技产品提供动力。随着AI行业蓬勃发展,各大科技公司和AI实验室——都在争夺最强大、最高效的AI——购买大量RAM来装备数据中心,导致市场所剩无几。供不应求意味着剩余芯片越来越贵。 这波及了游戏业(大公司不得不提高游戏机价格,因为内存芯片更紧缺)、消费电子(内存短缺可能导致十多年来智能手机出货量最大降幅)以及普通企业计算(这些公司无法为自己的数据中心获取足够RAM)。价格飙升只有在可怕的短缺结束后才会停止,但不幸的是,眼下没有迹象显示这种情况会很快发生。 强化学习 强化学习是一种训练AI的方式:系统通过试错并因正确回答而获得奖励来学习——就像用零食训练宠物,只不过这里的“宠物”是神经网络,“零食”是一个表示成功的数学信号。与监督学习(模型在固定标签数据集上训练)不同,强化学习让模型探索环境、采取行动,并根据接收到的反馈持续更新行为。这一方法在训练AI玩游戏、控制机器人以及最近提升大语言模型推理能力方面,已被证明特别强大。从人类反馈中强化学习(RLHF)等技术现已成为领先AI实验室微调使其模型更有帮助、更准确和更安全的核心手段。 令牌 在人机通信中,存在一些显见挑战——人们使用自然语言,AI程序则通过复杂算法过程执行任务。令牌(Token)架起了桥梁:它是人-机通信的基本构建单元,代表LLM处理或生成的离散数据段。令牌通过称为“令牌化”的过程创建:将原始文本分解为语言模型可以消化的微小单元,就像编译器将人类语言转换为计算机能理解的二进制代码一样。在企业环境中,令牌还决定了成本——大多数AI公司按令牌数量对LLM使用收费,使用越多,付费越多。 令牌吞吐量 再次说明,令牌是AI语言模型在处理文本前将其分解的小片段(通常是词的一部分而非完整单词);就理解AI工作负载而言,它们大致相当于“单词”。吞吐量指单位时间内能处理的数量,所以令牌吞吐量本质上衡量的是系统一次能处理多少AI工作。高令牌吞吐量是AI基础设施团队的关键目标,因为它决定了模型能同时服务多少用户,以及每个用户收到响应的速度。AI研究员 Andrej Karpathy 形容,当他的AI订阅闲置时他会感到焦虑——就像当年读研究生时昂贵的计算机硬件没得到充分利用的感觉——这恰当地说明了为何最大化令牌吞吐量已成为该领域的一种执念。 训练 开发机器学习AI涉及“训练”的过程。简单来说,训练就是喂入数据,让模型学习模式并生成有用输出。本质上,这是系统对数据特征作出反应的过程,使其能够调整输出以达到预期目标——无论是识别猫的图像还是即兴创作一首俳句。 训练可能很昂贵,因为它需要大量输入数据,而且所需数据量还在不断上升——这就是为什么混合方法(比如用特定数据微调基于规则的AI)可以在不完全重头开始的情况下控制成本。 [参见:推理] 迁移学习 一种技术:将预先训练好的AI模型作为起点,为不同但通常相关的任务开发新模型——从而重新运用先前训练周期中获得的知识。 迁移学习可以通过缩短模型开发流程来节约效率,在目标任务的可用数据有限时尤其有用。但要注意,这种方法有局限性。依赖迁移学习获得通用能力的模型,很可能需要在目标领域额外训练数据才能表现良好。 (参见:微调) 权重 权重是AI训练的核心,它决定了训练数据中不同特征(或输入变量)的重要性(即权重),从而塑造AI模型的输出。 换句话说,权重是数值参数,定义了数据集中哪些因素对给定训练任务最关键。它们通过对输入执行乘法来实现功能。模型训练通常从随机分配的权重开始,但随着训练推进,权重会根据模型试图更接近目标输出而不断调整。 例如,一个基于历史数据预测特定地段房价的AI模型,可能包括卧室数量、浴室数量、房屋是独栋还是半独立、是否有停车位和车库等特征对应的权重。 最终,模型赋予每个输入的权重,反映了它们基于给定数据集对房产价值的影响程度。 验证损失 验证损失是一个数字,告诉你AI模型在训练过程中的学习效果——越低越好。研究人员像盯实时成绩单一样密切跟踪它,用它来决定何时停止训练、调整超参数,或在需要时排查问题。它帮助发现的关键问题之一是过拟合:模型死记硬背训练数据,而非真正学习能泛化到新情况的模式。这就像真正理解知识的优秀学生与只会背去年考题的孩子之间的区别——验证损失恰恰能揭示你的模型在成为哪一种。
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kx/29397.html