AI算力争夺战:下一个Cerebras已现真身?

编者按: 在这个AI算力井喷的时代,每家公司都在拼命抢占芯片和机房,但真正的商机藏在“推理”环节里——当模型学会所有知识后,如何快速响应你的每个指令?通用计算公司不走寻常路,他们押注一种被硅谷遗忘的芯片,声称能把推理速度拉到GPU的三倍。更妙的是,这种芯片还不用水冷,随便找个机房插上电就能跑。这不是技术幻想,而是价值6000万美元的赌局。当英伟达忙着卖黄牛价,Groq靠IPO套现,这家公司要用性价比杀出一条血路。接下来这篇来自TechCrunch的头条报道,将揭示他们如何用新玩法挑战算力霸权。
运行AI模型对算力的狂飙需求仍在加速,但从业者必须跨越两大障碍:获取合适的芯片,并将它们安装进能产生营收的数据中心。
通用计算公司(General Compute)——一家新型推理云服务商(出租AI处理能力,专注于模型运行并响应用户而非训练的环节)——为这些问题找到了答案,这些答案也揭示了AI生态的未来走向。正是这些方案帮助该公司完成1500万美元种子轮融资,投后估值6000万美元,由FUSE VC领投,Carya Venture Partners和Village Global Ventures跟投。
首先,什么是合适的芯片?GPU需求已一飞冲天,但业内逐渐形成共识:它们在模型训练后并非运行AI的最佳选择。模型主动生成响应时的推理阶段,计算需求与训练截然不同,一批新芯片正在为此专门设计。去年12月英伟达以200亿美元收购Groq、以及上周Cerebras的57亿美元IPO,都印证了这一趋势。
在这两家公司产能紧张的情况下,通用计算的联合创始人兼CEO芬恩·普克洛夫斯基与CTO杰森·古迪森找到了另一条路。他们转向SambaNova的专用芯片——这家英特尔支持的芯片公司主攻推理,但已逐渐淡出硅谷视野。
情况可能今年就会逆转:SambaNova即将发布新芯片。其架构更灵活,推理计算时能用更多内存存储上下文,公司宣称性能不仅超越GPU,也胜过Groq或Cerebras等竞品。普克洛夫斯基透露,新芯片每秒可生成600-700个token,而GPU约为250个。
通用计算已订购价值3亿美元的SambaNova SN50芯片,并自称将成为首家部署该芯片的推理云服务商。
这些芯片还解决了第二大难题——安置地点。它们是风冷而非水冷设计,且功耗更低,因此无需新增基础设施投资就能直接安装在现有数据中心。
普克洛夫斯基正在推进托管合作——将自家硬件安装在其他公司场所——对象不仅包括数据中心运营商,还有那些因挖矿成本常超比特币价格而寻求转型的加密货币矿工。
上周,通用计算正式推出云服务,并声称在运行强大开源大模型MiniMax 2.7时速度已居业界最快。
投资人乔·哈塞尔曼早在2021年投资Groq时便看准了推理热潮。今年他创立专注于AI领域的新基金Evercrest Capital Partners,并将通用计算作为首投项目。他认为,SambaNova与通用计算的合作,堪比Coreweave与英伟达的联盟,也类似Groq芯片与云业务的组合。
“芯片公司需要健康多元的客户群,将芯片部署在高增长环境中,”哈塞尔曼表示,“就像通用计算押注SambaNova一样,SambaNova也在押注通用计算。”
关键在于,何种计算架构能在AI未来攫取最大价值?推理云本质上是在押注一个多模型、多智能体的世界——没有单一供应商能统治全局,推理速度和成本将成为核心竞争力。本周OpenRouter获1.13亿美元C轮融资,正体现了该公司通过提供多模型访问来帮客户优化token支出的能力。
速度决定了价格与能力。普克洛夫斯基希望将编程智能体原本一小时的耗时压缩到五到十分钟,并让需要快速推理才能有效对话的客服语音智能体变得更经济。
“你用ChatGPT时每秒50个token的响应速度,已经比人类阅读快太多,”普克洛夫斯基告诉TechCrunch,“但如今智能体间通信时代来临——智能体替我们阅读或查询数据库时,它们需要更快的速度。”
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kx/50568.html