英伟达联手三星推出LPU芯片,AI推理效率飙升引爆行业变革

英伟达在其年度大会“GTC 2026”上揭晓了一款专为快速推理而设计的语言处理单元(LPU)。这款由去年收购的初创公司“Groq”研发的芯片,正由三星电子制造。英伟达计划通过同时使用图形处理器(GPU)和LPU,来提升推理性能并改善“令牌经济”,即成本效益。

当天,首席执行官黄仁勋预测,到2027年,GPU订单额将达到1万亿美元,并表示:“智能体AI将开启下一个前沿。”尽管存在“AI泡沫”的争议,认为AI需求和企业估值被高估,但市场评估显示,全球目光仍聚焦于GTC,这反映出对AI需求持续强烈的预期。

◇ 英伟达发布专攻快速推理的LPU

当地时间16日,英伟达在加利福尼亚州圣何塞举行了年度大会“GTC 2026”。公司发布了专为快速推理设计的专用芯片LPU“Groq 3”,并宣布其将集成到下一代AI超级计算机‘Vera Rubin’中。Groq 3由英伟达去年以20亿美元收购的初创公司Groq开发,计划于今年下半年开始出货。

英伟达通过整合这两种芯片来提升推理效率。生成式AI模型分为两个阶段:训练(处理海量数据)和推理(基于训练结果向用户提供答案)。训练阶段需要巨大的计算能力和大量GPU,而推理阶段则优先考虑效率,因此对低成本、低功耗芯片的需求日益增长。随着AI模型和智能体的进步,企业能够全面部署AI实现自动化,推理性能变得比训练更为关键,提升推理效率已成为盈利的关键。

GPU在多功能性、生态系统和大规模处理方面表现出色,而LPU则在语言推理的延迟和可预测性方面展现优势。如果说GPU像掌管整个餐厅的主厨,那么LPU则像专注于特定菜肴的专业厨师。英伟达解释称,同时使用两种芯片可以提升性能和效率。首席执行官黄仁勋表示,这种分工可以将具有万亿级参数的超大AI模型的推理吞吐量提高35倍,并增强低延迟推理能力。例如,在呼叫中心AI中,GPU可以处理客户信息查询、法规检索以及多个模型的同时运行,而LPU则可以即时生成回应,如同真人客服一般。尽管GPU也能承担此角色,但其速度较LPU慢,成本也更高。

首席执行官黄仁勋表示:“现在重要的是谁能更便宜、更有效地进行推理,即令牌经济,”并补充道:“我们将成为令牌之王。”

三星电子的代工厂负责制造这款芯片。这延续了Groq在被英伟达收购之前就已启动的生产合同。在当天的主题演讲中,首席执行官黄仁勋表示:“三星正在为我们制造Groq 3 LPU芯片,并正在尽可能快地扩大生产规模,”并补充说:“我们感谢三星。”当天,三星电子在圣何塞会议中心开设了展厅,展示了LPU及其生产所用的晶圆。

英伟达还首次公布了其‘Vera Rubin平台’的愿景,这是一个设计为单一集成单元的系统,涵盖了下一代GPU、CPU、LPU、网络和存储。英伟达此前在1月的CES上已宣布了搭载CPU‘Vera’和GPU‘Rubin’的下一代AI加速器‘Vera Rubin’。现在,公司计划也将LPU纳入其中。目标是创建一个不仅在训练方面出色,在推理方面也卓越的‘AI工厂’。首席执行官黄仁勋表示:“我们销售的不仅仅是一颗芯片,而是一个包含软件在内的庞大集成系统。”

◇ 计算需求将持续增长

首席执行官黄仁勋预测,对计算能力的需求将继续增长。他透露,当前一代GPU Blackwell和Vera Rubin的采购订单预计到2027年将达到1万亿美元——这是英伟达去年公布的这两款芯片5000亿美元销售预测的两倍。首席执行官黄仁勋表示:“下一波浪潮——智能体AI时代已经到来,”并补充道:“计算需求已经增长到无法控制的程度。”

尽管存在AI泡沫争议,全球的关注和兴趣仍集中在GTC上。评估认为,这表明市场持续强烈预期计算能力需求将以当前水平继续增长。虽然这是一个特定公司主办的会议,但它吸引了与全球最大的IT和电子展览会CES同等的关注,有反馈称它实际上已成为最大的AI盛会。美国金融媒体《巴伦周刊》将GTC介绍为“改变华尔街AI泡沫论者看法的最佳活动”。

实际上,当天早上8点左右,在主题演讲开始前三小时,圣何塞会议中心外已经排起了长队。会议中心的停车场在早上8:30左右就已停满。作为GTC 2026的首场活动,主题演讲在一个可容纳18,000人的场馆举行。路透社将其介绍为一场“巨型会议”。

本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/biz/11462.html

联系我们

在线咨询:

邮件:sooting2000@qq.com