ComfyUI估值飙至50亿!创作者争夺AI内容控制权

编者按: AI生成内容正以惊人速度渗透创意行业,但“六指魔咒”“画风失控”等翻车现场总让人哭笑不得。当Midjourney和DALL-E还在赌场式抽奖中撞大运,一家名为ComfyUI的开源工具悄然崛起,用节点式工作流把AI创作扭转为精密工程。近日,这家初创公司以5亿美元估值斩获3000万美元融资,背后是Craft Ventures等资本对“精细控制权”的豪赌。从VFX特效到工业设计,数百万创作者正用“人机协作”对抗劣质AI内容泛滥——毕竟,当满屏都是AI垃圾,能精准调校最后20%细节的工具,才是真正的赢家。现在,让我们翻开这篇TechCrunch独家报道,解析ComfyUI如何颠覆AI创作逻辑。
以节点式工作流帮助创作者精准控制扩散模型图像、视频及音频输出的初创公司ComfyUI,刚完成3000万美元融资,估值高达5亿美元。
本轮融资由Craft Ventures领投,参投方包括Pace Capital、Chemistry和TruArrow等机构。
ComfyUI于2023年以开源项目起步,彼时扩散模型刚崭露头角。当时的Midjourney和OpenAI的DALL-E还漏洞百出,常常闹出给手掌多补一根手指这种低级错误。
为突破这些限制,项目创始人开发了一套模块化框架,让创作者能像外科医生般精准操控生成流程的每个环节。
这款工具在创意专业人士中迅速蹿红,最终蜕变为正规初创公司。2024年底,ComfyUI完成1900万美元A轮融资,投资方包括Chemistry Ventures、Cursor Capital及Vercel创始人Guillermo Rauch。
尽管最新扩散模型已彻底告别“六指琴魔”时代,但ComfyUI提供的微观精度反而愈发不可或缺。
“想象典型提示词式解决方案——比如Midjourney或ChatGPT,你说个需求,它大概能搞定60%到80%”,ComfyUI联合创始人兼CEO Yoland Yan向TechCrunch解释,“但若要调整剩下20%,你就得赌一把老虎机。”
Yan(左图)将这个过程比作赌场豪赌:微调提示词可能导致输出结果面目全非,甚至覆盖已完美的部分。
ComfyUI的节点式界面让创作者能像拼接乐高般串联生成流程的各组件,全程掌控成片质量。
“你根本没法在基础模型的提示框里表达那么细腻的需求,”Yan表示。
创作者们显然认同这一点——ComfyUI声称已积累超400万用户。
从视觉特效、动画制作、广告营销到工业设计,这款工具已成创意专业人士的标配。
据称,对于技术美术师等创意群体而言,ComfyUI已是行业必备工具。工作室招聘平台上,“ComfyUI艺术家/工程师”这类职位正越来越常见。
尽管视频与图像基础模型持续进化,Yan认为它们离完美还差得远,像ComfyUI这样的工具将持续供不应求。
“当AI垃圾遍地都是,坚持人机协同的Comfy式玩法,终将收割最值钱的注意力,”他断言。
ComfyUI的竞争对手包括去年被Figma收购的Weavy等公司。
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kx/21614.html