这家芯片公司刚融资1.35亿美元,赌AI的最大瓶颈不是算力,而是内存

编者按:AI领域的一场芯片革命正在悄然发生。当大模型生成每个词都要在CPU、GPU与内存之间上演“数据接力赛”时,这种结构性瓶颈带来的高昂成本触目惊心。一家名为XCENA的初创公司,从内存巨头的经验出发,给出颠覆性方案:把计算能力搬到内存旁边去。这不是小打小闹的优化,而是可能彻底改写AI基础设施成本逻辑的尝试。下面这篇文章,带你解密这家新锐企业如何用“近内存计算”打破传统架构的掣肘,以及它凭什么能在三星、SK海力士等巨头环伺的战场中脱颖而出。原文发表于TechCrunch,现编译如下,保留原意,仅在语境上做本土化处理。
每次你向ChatGPT提问时,你的请求都会触发一场数据接力赛。信息离开内存,经过CPU预处理,再传递到GPU进行繁重计算,然后返回——而AI生成的每个词,都要重复这一完整旅程。
这个瓶颈是结构性的——意味着每次请求都要绕经业内最昂贵、最耗能的芯片。正是这种低效问题,让一家在韩国和美国都设有办公室的初创公司XCENA试图破解。这家成立四年的公司设计了一款芯片,将计算能力大幅靠近DRAM——这些快速、短期的存储芯片负责保存处理器当前使用的数据。这样一来,常规的数据操作就能在内存附近完成,无需CPU、GPU和内存之间的昂贵来回传输。
如果这项技术能大规模落地,对AI基础设施成本的影响将不可小觑,这也解释了为何投资者对该国市场热情高涨。事实上,XCENA刚在B轮融资中筹集了1.35亿美元,估值达到5.7亿美元,累计融资额已达1.85亿美元。
XCENA的CEO金鎮(Jin Kim)在2022年与CTO金道勋(Dohun Kim)及CPO金贤俊(Harry Juhyun Kim)共同创立了这家公司。三人均为三星和SK海力士的资深人士——这两家内存巨头正是为英伟达GPU供应芯片的企业。”过去几十年,CPU和GPU都变得更智能,但内存从未变过。XCENA想改变这一点,”金鎮在接受TechCrunch采访时表示。”近期内存价格和相关股票上涨,表明AI基础设施正向以内存为中心的架构转变,”他补充道。(本月,主导全球内存芯片市场的三星、SK海力士和美光三家公司的估值首次突破万亿美元。)
XCENA把赌注押在这样一个论点上:”推理不仅是一个计算问题,它越来越是一个内存扩展问题,”金鎮说。
XCENA的芯片MX1通过CXL(Compute Express Link,计算快速链接)连接到CPU——这本质上是一条处理器与内存之间的专用快车道——在数据离开内存模块之前就完成处理。它将计算带到数据身边,而非数据去迁就计算。公司声称,过去需要10台服务器才能完成的任务,现在可能只需一台。
“虽然GPU擅长矩阵乘法——这是AI模型训练背后的繁重数学运算——但许多外围的数据编排工作,包括预处理、KV缓存管理(存储先前对话上下文的系统,以避免模型重复处理)和数据缓存,仍然在CPU上运行。我们的芯片直接在内存模块内处理这些任务,”金鎮表示。
自去年下半年以来,对内存解决方案的需求激增,公司认为时机对它们有利。
与几家全球内存供应商的谈判还处于早期阶段,不过金鎮拒绝透露具体名称。公司的理想客户是那些每年在AI基础设施上花费数百亿美元的超大规模云服务商,因为即使只在内存效率上取得小幅提升,也能带来数亿美元的节省。
MX1仍是原型产品。量产芯片计划于2026年底在三星的代工生产线上推出,公司预计从2027年开始产生营收。
虽然神经处理单元(NPU)制造商正在竞争挑战英伟达在训练负载领域的主导地位,但XCENA瞄准的是所有这一切之下的内存密集型层级。
XCENA最接近的竞争对手包括Astera Labs和Marvell,这两家公司都在纳斯达克上市,从事下一代内存连接技术的研究。金鎮表示,Marvell是一个已经在同一领域开展业务的大型成熟企业,而差异点在于知识产权。”我们有数千个核心,”金鎮说。根据公开规格,相比之下,Marvell的方案依赖少量通用核心。
这些核心基于RISC-V(一种开源芯片设计蓝图)构建,并针对数据处理进行了专门优化,每个核心都刻意保持小巧高效。除核心本身外,XCENA还自主设计内部内存层次结构、互连总线和DRAM控制器——这种垂直整合的深度,是大多数芯片公司(包括更大的竞争对手)通常会外包的。
总部位于首尔的风投公司Altinum和IMM Investment共同领投了本轮B轮融资,参与方还有Corstone Asia以及现有投资者SBI Investment和Mirae Asset Capital。该公司在首尔以外的科技中心板桥(Pangyo)和美国桑尼维尔(Sunnyvale)设有办公室,拥有90多名员工。目前,他们正在与国际投资者就额外融资进行洽谈。
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kx/51786.html