5亿美元估值背后的信号:创作者为什么开始「逃离」Midjourney和DALL-E?
5000万估值,30M融资,这个数字在AI工具领域不算小,但真正值得关注的不是钱,而是钱背后的信号——ComfyUI到底做对了什么?
先说ComfyUI是什么。简单讲,它不是一个AI生成模型,而是一个工作流平台,让创作者可以用极细的粒度去控制AI生成图像、视频甚至音频。从模型权重到采样器选择,从噪点分布到每一步的迭代,所有这些参数都可以自己调。这意味着什么?意味着创作者不再需要对着输入框敲一句模糊的Prompt,然后祈祷AI“理解”自己的想法,而是像传统设计师一样,对最终输出有真正的控制。
这才是关键。
过去一年,Midjourney、DALL-E这些工具确实让生成式AI火出了圈,但它们的逻辑是用自然语言“指挥”AI,prompt engineering甚至成了一门显学。问题是,创意工作本身就不是能用语言精确描述的东西。当一个艺术家说“我想要一种孤独的感觉”,他没法通过prompt让AI准确理解这种抽象表达。创作者需要的是逐步调整、反复迭代的过程,而不仅仅是“输入-输出”这一下。
ComfyUI抓住的就是这个痛点。它的估值,说明市场认可了“精细控制”这条路线,但也带来一个问题:这条路会不会太专业了?普通创作者真的需要这么复杂的控制吗?
我的判断是,AI生成工具正在经历一个分裂。一端是面向大众的“简单好用”,比如Midjourney和DALL-E,它们降低了创作门槛,让任何人都能生成看起来不错的图。另一端是面向专业创作者的“深度控制”,比如ComfyUI,这类工具的价值在于提供完整的创作工作流,而不是某一次生成的效果。
未来会怎样?我大胆预测三条趋势:
第一,“Prompt民主化”会退潮。不是-prompts要消失,而是单纯靠写prompt就能做好创作的日子过去了。工具会进化,工作流的复杂度会从prompt层面转移到参数层面。
第二,工作流工具会成为新的兵家必争之地。ComfyUI的5亿美元估值开了一个头,接下来会有更多资本和玩家进入这个赛道。
第三,专业创作者的价值会被重新定义。当AI能一键生成“看起来不错”的东西时,真正区分专业和业余的,不是审美和创意,而是对工具的掌控力。你能不能用ComfyUI调出别人调不出的效果?这才是未来的核心竞争力。
对普通创作者来说,该怎么办?我的建议是:别把所有精力都花在优化prompt上,学一点工作流、学一点参数调优,这些能力会有更高的护城河。AI会越来越会“听”话,但不会越来越会“创作”。创作这件事,最终还是得靠人来掌控。
来源 TechCrunch AI
阅读原文