
邮箱|marketing@pingwest.com
设计行业打造的 Agent 产品 Lovart引起了业界比较广泛的关注和讨论。5月27日,硅星人联合北京中关村科学城创新发展有限公司和北京中关村创业大街科技服务有限公司,共同举办了一场线上直播对话活动,我们荣幸地邀请到了北京工业设计促进会人工智能专委会执行主任雷海波、无界AI联合创始人马千里两位嘉宾参与。硅星人AI分析师周一笑和两位嘉宾探讨了Lovart 这个产品以及对设计行业的影响,以下内容是基于对话实录做的整理,有部分删减。
周一笑:先请两位做一个简单的自我介绍。
雷海波:长期在设计+互联网行业工作,曾创办中国最大的设计师社区视觉中国网站。之后创立太火鸟,专注于设计驱动的智能硬件的投资孵化,孵化了众多设计师主导创业的智能硬件公司。近年来,随着AI进入设计领域,孵化了杭州的造物云和灵动AI两家AI设计公司,最近参与了北京工业设计促进会人工智能专委会的筹备工作,担任执行主任。
马千里: 无界AI是一个国内较早的AI创作平台,覆盖图文、视频、3D内容,目前拥有500多万用户,包括C端和B端。最近推出了新产品无界魔镜。我本人是AI的早期狂热爱好者与测试用户,深度体验过如DeepSeek等平台,乐于分享前沿AI应用。
周一笑:第一次看到 Lovart这个产品或者说第一次用它的时候,大家感到最惊讶的一个点是什么?
雷海波: 坦诚地讲,第一次看到时最惊讶的并非所谓的世界首个人工智能设计智能体,而是我惊讶于为什么现在还有人投身人工智能设计创业项目。回顾历史,世界上最好的两个设计工具是Adobe(专注平面/影像/体验,曾市值3100亿,现受AI冲击市值波动回落到1700亿美金)和Autodesk(3D设计,市值约740亿),云协作时代出现了Canva(堪称AI设计先驱)和Figma(交互设计,后被Adobe200亿收购)。在AI时代,也涌现了原生工具如Adobe前AI负责人创立的TypeFace(融资1.5亿,估值10亿美金)以及众多国内外创业公司,包括我自己也投了两家。
但我发现它们大多未成功长大。究其原因,我认为过去工具是单机如adobe仅限专业用户;云协作如Canva、Figma,还是需要一些设计技能;而当前用户需要AI直接生成可商业化的结果。对于这一点上,我觉得可能目前所有的所谓的人工智能的设计工具都没有达到这个直接交付水准。所以在我们专业人士看来,我惊讶于这类纯AI设计项目能坚持多久,能长多大,以及它们真能实现所谓设计自动化吗?
马千里:我上手体验后感觉非常不错。它有点像MidJourney给我的感觉,突破了次元壁,能一键生成我最终想要的方案,而过去用Canva、Midjourney等工具都需要反复调整。它通过调用多模型、多智能体组合的方式,更好地释放了模型潜力,达到了在OpenAI对话框里无法实现的效果,我认为这是产品层面的出色创新。
周一笑:从两位的视角来看,所谓的设计Agent 和传统的 AI 绘图工具也好,设计工具也好,它最根本的区别是什么?
雷海波: 我要实事求是地讲,我申请了Lovart的访问权限但至今未获得邀请码。尽管如此,我看了很多评测文章和录屏。我认为它与Midjourney的真正区别不在于它是单体工具(设计是全流程的),而在于它似乎借鉴了设计师的思维链(模仿设计师的思考方式),这容易造成智能体的思考在形式上比人先进的假象。这也可能是非设计背景的科技博主的第一反应“设计师的天塌了”。
我完全不认同它“替代设计师,让人人做设计”的说法。它的核心区别在于这是一个智能体与单功能AI的区别, Midjourney生成图片的效率极高,在很多层面确实超越了普通设计师, 接近本科到研究生水平作品。但我认为Lovart目前产出的设计成果,最多只相当于刚入门一两年的初级设计学生的水准。
周一笑:从工业设计的角度来看,AI 的这种理解规划执行的能力对设计的流程意味着什么?
雷海波: 如果光说流程,它其实是一个复杂过程,其实我们其实可以把那个视线放再往前一点,就是所谓创造力的问题。关于AI能否替代人类创造力的问题,关键在于如何定义创造力。在我看来,创造力意味着提出新颖、令人惊讶且有用的解决方案,无论是想法、物品还是设计作品。它需要具备实用性、启发性和挑战性,对于设计来说,美学也是核心标准。
那么,人类的创意是如何产生的呢?首先是有意识的调研和素材收集,就像把作品贴在墙上或使用Pinterest画板进行可视化。只有积累了足够的素材,才可能在某个无意识的时刻迸发灵感, 就像大模型的“智能涌现”,没人能确切知道灵感何时、如何出现。接着,我们会尝试用语言解释这个思考,形成一个或多个解决方案,这时最终的结果是不确定的,属于模糊前期阶段。然后基于这些方向形成原型,迭代优化至终稿。
在这个过程中,我认为AI与人有两个根本性差异:第一,AI是否有强烈的解决问题的愿望?第二,它能否产生全新的解决方案?这正是人类的特质,且创造的结果必须是不可预测的,这正是“灵光乍现”的本质。回到AI在理解、规划、执行这三个层面的表现:
理解: AI似乎能生成详细的过程(思维链),但我质疑它是否有真正的灵感在先?感觉它只是在写出过程,模仿思考,或者只是形式上的思考。是否有情绪去感染人?设计需要打动人心,这点我存疑。
规划: 它调用不同工具时,是否具备想象力去选择最优解?它选择的是效率优先,还是质量优先?还是情绪优先?
执行: 由于缺乏前两点提到的愿望、灵感、想象力、情绪,其生成结果的质量堪忧。首先,设计依赖的数据并非越多越好,而是越精彩越好,但AI懂什么叫精彩吗?其次,它的思考过程可能依赖网上可见的教程或论文,但真正优秀设计师的想象往往不落言筮,大量设计研究论文也未必经过实践验证。因此,我对AI生成结果的价值是怀疑的。
所以,我的结论是:目前AI生成的设计内容,更像是让普通人也能产出的平均值内容,它缺乏真正的创造力核心要素,商业价值有限,人人成为设计师在当下并不现实。”
周一笑: 马总的无界 AI 作为一个 AI GC 的平台,我相信你们也接触到很多用户的反馈,你们是怎么看待工具到一个Agent的转变。
马千里:我认为,从工具到智能体(Agent)是必然的发展趋势,这也是应用层一个重要的创业机会。
很多平台已经证明,通过Agent可以深耕特定领域并做得非常好。在我看来,Agent很可能成为AI时代的APP,就像PC互联网时代主要用网页,移动互联网时代主要用APP一样,未来我们与AI交互的主要形式可能就是智能体。这是一个非常好的发展趋势和创业方向。
另一方面,Agent能有效释放模型的潜力,这比单一模型更强大。其理论依据类似于蜂群智能:单个蜜蜂或蚂蚁并不聪明,但群体协作能产生精妙的智慧。同样,多个不同分工的Agent,如知识Agent、代码Agent、检索Agent等自发形成的协作网络,也能涌现出超越单一模型的群体智慧。目前很多厂商已用Agent完成了单一模型无法做到的事情,这非常精彩。
站在我们无界AI平台的立场上,我们本身就是一个综合性平台,集成了多种模型,这些模型本身就可以组合使用,未来我们也必然会向Agent方向拓展。我认为这是所有平台和创业者都绕不开的趋势。
周一笑:问一下雷总,您这边接触的很多设计师群体对设计类的 AI Agent 这一类产品,他们的态度是什么样的,恐慌比较多,还是兴奋比较多。
雷海波: 我牵头成立的北京工业设计促进会人工智能专委会,汇聚了联想、京东方等北京一线制造业大厂的设计负责人,可以说,我们是国内首批专业探索AI在设计领域实际落地的组织,核心目标就是推动AI应用于一线设计生产环节。
作为专业设计背景的从业者,从AI兴起之初,特别是Midjourney出现,我们就深感震撼。几乎所有一线设计大厂都迅速开始用它辅助创意生成,尤其是在灵感激发阶段。但坦率讲,Midjourney作为通用模型,更偏向摄影、插画、游戏等行业,对工业设计的支撑明显不足。关键在于优质、大量的工业设计数据极其匮乏——顶尖大厂的设计作品都是保密的,市面上公开的少量获奖作品,比如红点奖,远不足以训练一个完善的细分品类模型。正因如此,我们看到国内一些大厂已着手研发符合自身调性、工作流和品类的专属小模型。
回顾设计工具发展史,从手绘喷枪时代,到Autodesk、Adobe等数字化软件普及,工具迭代虽让部分手绘师转型,但真正的专业设计工具至今未被颠覆,Adobe、Autodesk仍是核心。当前的AI工具,更多体现的是‘设计平权’,服务于非专业人群,尚未触及专业设计的核心。
不过我认为,AI时代确实存在普惠化设计工具的机会。比如Canva,其优势在于模板库,若它能转型为‘无模板智能体’,在调用层面实现接近甚至超越模板化设计的产出,潜力巨大——但这机会不在专业设计重新本身(从0-1的创造),而在于帮助普通用户高效完成‘从1到N’的延伸设计,这也是我们设计行业从最初对AI的担忧,转变为如今积极拥抱的关键原因。
马千里:在我们平台的早期,专业设计师用户居多,他们的需求聚焦于专业性和效率。为此我们推出了专业版,致力于简化工具,使其更贴合他们的设计语言和工作习惯。
现在业余爱好者用户的比例正在显著增加,他们的核心诉求是好玩和创意表达。他们热衷于用AI生成搞怪的图片、创作简单视频,或者通过拼接、组装不同模板碰撞出新风格。
但深入接触这些用户后,我们发现他们的需求其实非常直接且具体,他们不仅要生成图片,还希望拿到实体照片,渴望一种熟悉的、带有硬件体验的拍照感。这让我们意识到,这本质上不完全是AI需求,而是融合了实体体验的完整解决方案。
因此,我们推出了像无界魔镜这样的系列硬件产品,并专门开发了十种型号进行线下投放。这一切都是为了给用户带来直观的AI影像体验。可以说,专业用户和业余爱好者的需求是泾渭分明的,我们正针对性满足后者对“好玩”和“实体体验”的追求。
周一笑: 从更长远的视角来看,在设计领域这种 AI 产品的理想形态的终点可能会是什么?
雷海波 : 我认为关键要看大模型未来的发展。也许有一天,AI的想象力真会超越人类,但那意味着人类可能被AI“奴役”而无所事事,这当然是我们不希望看到的结果。我更期待的理想状态是:AI成为设计的最佳引擎,负责处理那些“苦力活”,而人类则担当“裁判”的角色,专注于判断什么是好设计、什么是坏设计。
马千里: 我认为,AI生成内容(AIGC)的终局将是逐步替代很大一部分用户生成内容(UGC)。2022年曾有预测认为,到2025年约20%的内容将由AI生成。但就目前观察来看(尤其是在小红书、抖音等平台),今年达到甚至超过这个比例已无悬念。
更重要的是,AIGC将彻底改变内容分发逻辑。过去在UGC时代,平台依赖算法推荐内容,用户主要通过划掉或点赞被动反馈,自主权有限。而在AIGC时代,我认为这种‘划掉’的动作也会被替代——平台不再需要费力推荐你喜欢什么,而是能直接创造符合你偏好的内容。这意味着:你看到的内容都是你喜欢的,引发你愤怒或狂热的内容也都是为你量身打造的。这是一个难以阻挡的趋势。
长远来看,用户与内容之间可能形成一种共生关系。当然,这是基于当前技术线性发展的一种纯粹技术想象,但在我看来,它描绘了AIGC未来极具潜力的发展方向。
周一笑:Lovart目前也是一个免费推广的阶段,模型的调用成本肯定也是不低的,两位怎么看待这类公司如何找到自己生存空间?
雷海波: 可能国内大部分投资人都觉得SaaS模式在中国创业很艰难,因为用户普遍缺乏付费习惯。结合我投资的两家公司经验来看,确实如此:我们起初聚焦于为电商营销从1到N的设计内容服务,和阿里、京东、字节等大平台深度合作。但现实是,这类大规模生成内容的需求,最终大平台都会选择自建。因此,我们后来转向承接单笔金额50-100万以上的大B项目,不过这类项目数量也有限。
所以,像Liblib这样资金充裕的创业公司,其模式在面向付费意愿强的海外用户时是可行的。但关键在于国内用户‘薅羊毛就走人’的心态普遍存在。这让我不得不怀疑他们对AI设计的信心有多坚定,光烧钱能支撑多久?
虽然我认同他们的方向正确,目前成果也不错,即使从专业角度看,生成内容对普通用户也够用,但考虑到未来巨大的模型调用和算力成本,其商业模式的可持续性(单位经济模型)是否真的成立,我认为这才是核心问题。
马千里: 我认为中国AI创业公司需要更远视一些。一个关键数据是,生成单张图片的成本从2023年7月的约1美分,已降至2024年7月的约0.1美分,下降非常快。因此,我建议创业公司提前布局,就像现在的Lovart,初期商业成本虽高,但一旦占领用户心智并积累用户,其第二、三年的套餐很可能实现盈利。这需要初期资本 的耐心,而国内投资在这方面相对缺乏。
我们看到一个现象:许多类似Lovart的创业企业,其创始人演讲、官网均用英文呈现,看似一家国际公司。这是因为他们主动寻求更偏向欧美资本的投资环境,这些资本更看重AI公司估值潜力,而非短期营收压力。因此,当前许多创业公司被动选择在海外寻找资本和市场空间,同时在国内努力降低算力成本并控制人员开支,以此开拓生存空间。
结合我们自身经验,正如雷总所说,国内C端盈利确实困难。我们虽拥有500多万C端用户,但盈利挑战巨大。而在B端,我们服务了许多世界500强和上市公司客户,这为我们提供了宝贵的喘息空间。另一方面,如果能切入线下场景,开发软硬件结合产品,对创业公司而言也是很好的选择。
周一笑: 大家刚才高频提到的另外一家Agent公司Manus,它是一个通用型 Agent,从应用落地或者说解决问题的角度来看,通用和垂直的 Agent 它各自的一些优势和挑战分别是什么?
雷海波 : 从大的分类来看,设计领域本身就包含不同的行业分支,并且各分支之间壁垒较强。例如,建筑设计与工业设计就分属不同领域,这两类从业者通常不会合作;时尚设计与建筑设计、工业设计也是如此。目前看来,Loveart这类工具更多面向的是相对普及的平面设计和营销设计,更为复杂的交互设计、工业设计还难以实现好的结果。
因此,我并不认为它是一个真正的垂类设计工具。如果真要定位为垂类工具,它应该更细分,就像Adobe那样,拥有专注于影像、平面、工业、交互等不同领域的专业工具。而现在的做法似乎是‘什么都能干’,这意味着它本质上什么都干不好,只能满足普通用户对普通水准作品的需求。
相比之下,像ManuS这样的通用型工具面向普通用户处理规划旅程、预订酒店机票等任务,本身就不涉及追求更高质量或创意的需求。我认为,这就是它与Lovart这类工具的关键区别所在
马千里: 我认为你提到的这两个Agent确实代表未来的竞争趋势。从我亲身体验来看, 当我同时让Lovart和Manus 为同一本书设计封面时,Lovart用更短的时间完成了视觉呈现更好的封面,而Manus花了更长的时间。在后续编辑的便捷性上,Lovart表现更优, Manus虽然也能做类似操作,但交互界面体验较差、操作更复杂耗时,不过它也具备这种潜力。
两者的区别在于:通用型Agent成本更低、速度更快,可拓展性也更高。比如在封面设计完成后,它能更快地将其转换成电子书网页并发布。因此我认为,通用型和专用型Agent可能会长期并列发展,未来趋势如何,我们拭目以待。
(文:硅星GenAI)