
无处不在的 UIUI, User Interface, where interactions between humans and machines occur.每天清晨,当你听到手机闹钟,睡眼惺忪又极不情愿地用指尖点触“稍后提醒”时,那可能是你新的一天和 UI 界面互动的开始;午休时对着咖啡机犹豫该选美式还是卡布奇诺,液晶屏上跳动图标和提示也属于 UI 界面的一部分;深夜打车回家,闪烁着幽蓝光的车载屏幕还是 UI 界面。当然,最常见的是你拿出手机后的每一次操作,都是在和 UI 界面打一次照面。你可能习惯了让 AI 生成朋友圈文案、插画甚至短视频,却未曾注意到——每当我们打开一个应用,那些精心排布的界面,都是这个数字世界下庞大的 “基础隐形设施”。据统计,全世界单日新增的 UI 界面已达千万量级,这个数字对应了一类巨大的生产资料需求。当生成式 AI 已席卷文字、图片、视频领域时,它在 UI 领域,正在和即将带来哪些变革?初代生成式 UI:“玩具” 初稿,“套模板” 技术路线大约在 9 个月前,妙多推出了 AI 生成 UI 界面的功能。这个功能的交互简易明了:用户通过描述一段对产品界面的提示词,由 AI 生成对应的 UI 界面。妙多在 24 年对 AI 生成功能给出的一个样例妙多并非这个方向的首创。要追溯最早推出这类功能并产生影响力的,应该是 Galileo AI,他们在 2023 年 2 月首次预告了利用 AI 生成界面的功能。2024 年 6 月,Galileo AI 宣布平台生成的界面总数达到 160 万,同一个月内妙多和 Figma 都推出了 AI 设计生成功能。当时我们曾评测过在同一时间针对相同的提示词,各家的生成结果:尽管在那时网上对“UI 设计是否已被颠覆”有一些讨论,但大多的专业设计师普遍将这些生成功能视为 “玩具”。他们认为,生成结果最多只能作为快速可视化初步想法的参考图。为什么这么说?要评价生成的 UI 界面是否达到可用性标准,基础的下限是 “界面美观、布局合理”。在下限可满足后,可有两个维度评估可用性:• 表达力:UI 界面是一种文字、图片、样式信息的混编表达。依据不同产品需求和场景,表达有简单和复杂之分。• 特定风格:我们日常使用一款产品,包含不同的界面,这些界面从整体看视觉风格是一致的,或是用户单看其中一个界面,容易通过视觉标识识别这是哪一款产品。在专业领域术语里,这种一致性是依赖“设计系统” 约束设计师达成的。“设计系统” 是一套复杂实践,它不仅定义了一个业务和品牌显性的视觉元素,也阐述了这些元素的实践规范。初代生成式 UI 在这两个维度:• 表达力:受限的简单。这种状态,有点像将英语作为外语的初学者,能表达出 big,却表达不出 massive, enormous。• 特定风格:虽然生成的界面也有特定风格,但种类一般固定为很少的一类或几类。就像演员如果只能穿一套或两套固定风格的服装,就无法满足多样化的舞台要求。 双重受限下的“玩具”表达力和风格支持都受限,原因归结于技术路线。我们不难理解,UI 并不只是一张如插画般的图片,它更像有逻辑与结构的 “信息容器”。生成式 UI 变得可能,则主要得益于 LLM 技术提供了一套有逻辑和结构的表述。在 LLM 擅长的领域里,AI 生成代码一直是被基础模型广泛评测和落地的重要能力。因此,一种很直觉的思路是让 AI 先生成产品界面对应的前端代码,再把代码呈现为界面。有趣的是,原有生产流程都是先有界面再有代码,在 AI 擅长的领域这个流程被逆向了。依据这个思路我们进行了一些实验,以下是我们曾经使用 GPT4 生成一些代码后再还原为界面的例子:我们进行了不少生成实验,但这些生成的界面在美观、布局合理性上距离预期的下限甚远。我们猜测,可能是那时的大模型在预训练上,前端代码或是关系到样式的代码的数据规模量不够,或是并没有在训练中激发模型对 UI 界面的“审美”能力。出于对“美”的底线有要求,我们决定尝试新的技术路线。虽然大模型直接生成前端代码转化为 UI 效果不佳,但它在理解人的设计意图,以及识别 UI 本身两方面都表现出不错的能力。我们拆分这两项能力:• AI 理解设计意图:当用户用自然语言表述时,AI 可以理解用户的需求是什么,并需要哪些模块来展示这些需求。1)如果用户只是很简单表述需求,AI 可以一定程度“扩写”来完善需求,并陈列展示的模块。2)如果用户详细地表述需求,AI 也可以较好地把不同的需求内容归类到不同的模块。• AI 识别 UI:上一步,AI 理清了哪些模块展示,这里 AI 则是能识别使用哪些 UI 模块适合展示这些信息。我们可以给定较多美观的模块让 AI 来选择。基于以上思路,一种“套模板”的技术路线应运而生。 意图 —> 自上而下的页面结构 —> “套模板”后的 UI 界面这个“套模板” 路线一方面需要 AI 将用户的意图梳理成可表达的结构,另一方面需要 AI 从已经预制好的模板库中挑选合适的模板组件,自上而下的“拼装”。为了简化这个技术路线的运行机制,我们用上图表达了原理。但是,由于 AI 在梳理如何表达结构的同时,它已经“知道”什么是可以表达的,所以上面过程中的后两步并非是分步完成的,而是“一气呵成”的。我们通过对开源模型的微调,最终使得这个技术路线可行。“套模板”的过程有点像拼乐高,你已经知道你有哪些乐高组件了,你基于这些组件来组装你的创意。而因为模板是提前绘制好的,所以生成界面的美观度和布局都比较可控,通过这种方式守住了“美“的下限标准。但是,这条技术路径的局限性是:并非所有的用户描述都能真的寻找到匹配效果适宜的模板,寻找不到时只能尽力降级处理。有时候,即使找到了不错的匹配模板,模板的粒度不够细,也无法完全满足用户的表达需求。换句话说,这条路径在表达力的上限,受限于我们提前预制模板的丰富程度和细致粒度。24 年 7 月,用户 Andy Allen 在 X 上质疑了 Figma 的 Make Design 功能,指出使用 AI 生成的天气界面,和 iOS 原生的天气界面非常雷同。这引发了设计圈热烈的讨论,大家在辩论 AI 会不会让更多的设计无比趋同。Figma 的 CEO,Dylan Field 澄清了这个错误,坦诚这是 “Ultimately it is my fault for not insisting on a better QA process for this work and pushing our team hard to hit a deadline for Config. 为了赶工功能上线而没有进行充分的 QA 工作” 而造成的。Figma 快速下线了 Make Design 功能,并在整改 2 个多月后重新上线,并把功能更名为 First Draft。如果你理解了初代生成式 UI 的技术路线,应该不难理解,为什么 Figma 会出现这样的问题 —— 生成功能的背后包含了大量设计师绘制的模板,一方面”天气“这个品类的 UI 界面总量就不多,而可能这位绘制天气组件模板的设计师偷了点懒,过多地借鉴了苹果原生的界面。初代生成式 UI 距离真正改变生产力的差距,或许就是“玩具” 版 First Draft 和真正 Make Design 的差距。技术革新:表达力从简单到复杂,灵感涌现有一种技术预判的假设是:如果基础模型进步没那么快,“套模板”这个技术方案持续的时间足够长,依靠不断的扩充模板会不会成为可行的产品道路?毕竟每扩充一些新模板,就能多满足用户的部分需求。我们甚至考虑过要不要组建一支专业的设计师内容生产队伍,来提升模板数量和丰富性。我将这条发展路径称为“模板商店”。我们通过不断提供更多模板,一方面可以提供更多的风格让用户选择,另一方面也一定程度增强了表达力。这个思路类似无代码搭建网站的产品,如 Wix,Shopify 等,它们都有自己的“模板商店”。对这个技术预判的纠结持续了四个月,我们最终并没有选择这条道路,但同时我们在生成 UI 上进展缓慢。在这进展缓慢的四个月里,我们的产品研发团队对“代码转 UI”的技术路线一直念念不忘。这也使得每一次基础模型有较大更新时,无论开源还是闭源,我们都很热衷测试一把。上面两个例子都是在 Claude 3.5 Sonnet 发布之初的测试。它确实有一些惊艳:例如生成“天气”的卡片时它甚至带上了一些与众不同的创意。但它和我们划定的“美”的下限仍有差距,且生成的内容中有很多不符合 UI 设计最基础规范的问题。事情的转机大约出现在 24 年 11 月, Claude 3.5 Sonnet 在代码生成领域的重大革新,对产研领域具有里程碑意义。我们也在这个时间后,见证了其他一些基础模型,如 Qwen 等在代码生成领域长足的进步。当我们持续不断地在“生成代码转 UI”路线上进行实验时(包括提示词工程和微调),某一天,惊奇的事情发生了:“某一次” 突变的实验结果再来看看“表达力”呢?AI 爆发出无限的表达潜力。上面的例子中(第二张图),我们甚至生成了一个有模有样的“3D Map 编辑器”——这并不是一个常见的界面设计。如果使用原来“套模板”的思路,除非我们自己预制了这么一个不常见的模板,否则 AI 绝无可能生成这样的界面。从此,生成式 UI 进入了一个新的阶段:由 AI 生成的界面不再只是一个表达力简单的“玩具”初稿。它可以呈现出更复杂的设计,也支持了更自由的风格。即使这些设计结果还无法匹配业务的设计风格,但它可以充分地向产品设计者提供多样的设计方案作为参考,这个价值提升是巨大的。这个阶段的到来是突变的,又蕴藏无限的能量,我称其为“灵感涌现”。灵感涌现下,AI 能丰富表达出各种 UI。用户再也没有相同的提示词,多次生成雷同界面的问题。基于设计系统的 UI 生成:是拐点,也是开始生成式 UI 还面临着另一个关键问题:每个业务都有自己的设计风格,如何满足不同业务个性化的风格(也就是如何遵循业务的设计系统)。当我们还在走“套模板”技术路线时,有一些中大型企业的设计团队和我们一起共创想法,他们提出过两个有意思的见解:•“表达力”受限对于我们不是障碍,反而是一种需求!我们一点也不希望我们的设计师百花齐放,我们就希望他们完全遵循我们已有的组件模板(这一刻,我更理解了为什么设计领域常有观点批判“设计系统”,企业的这种控制欲是反感的根源)。•妙多既然已经实现了 AI 基于特定设计风格的生成,那如果我们授权数据给你们训练,是不是你们就可以基于我们自己的风格进行生成了?这是一种另类的“模板商店”的思路,意味着我们的商店要经营不错,还需要完成客户的私人定制。我认为,这个思路至今也仍具备一定可行性,或是说对一类设计团队行之有效。但是,过去一年的产品开发经验让我们也进行了反思:我们究竟是应该匹配已成熟的技术(Technology),打磨产品(Product)以实现 Product-Technology-Fit;还是,我们应该更信仰模型最终会快速进化,用动态的思维去看待问题,时刻准备承接未来新模型技术溢出的能力?这一次,我们更坚定地选择了后者,暂缓了“模板商店”这条并不适应 AI 能力进化的方向,全力转向生成代码路线。转变路线后,我们在生成实验过程中,发现了一个有趣的现象:如果你告诉 AI 直接生成大众的产品界面,它似乎“懂得”这款产品的设计系统。观察下面两个界面:“bnb 外卖”乍一看,你是不是有些恍惚,这是 Airbnb 开设的外卖业务吗?以上两个界面,是我们在妙多中让 AI 参照其它外卖产品的界面生成的。在生成界面的提示词里,我们提到了“请遵循 Airbnb 的风格进行设计”,除此之外并没有额外在风格上进行其它提示或训练。因此,我们推断大模型在预训练过程中,“见到过”这些大众产品的界面并一定程度“学会了”,使得生成结果可以匹配风格。当然,如果仔细考究,它在遵循风格规范上并不严格。同时,更多的产品是非“大众”的,基础模型并未“学过”。但这个发现,让我们转向对一条新技术路线的探索:如果我们把模型也看作一个设计师,为什么不试着让他在做设计时“读懂”你的设计系统?打个比方,我们做的像是一种“解码式翻译”工作,向大模型输出一套它能够读懂、也能较好遵循的设计系统。截至今日,我们在这条路线上已有一些不错的收获。我们的“翻译”工作已能让模型基于一些通用大型的设计系统,稳定准确地生成界面。同时,我们还搞定了风格的配置,意味着用户也可以个性化的改编风格。例如:基于 Ant Design 生成的一套风格统一的健身房后台界面以上这一套界面设计是基于开源的设计系统 Ant Design 生成的。你可以看出,我们定制化了风格样式,输出的界面样式风格也保持了很好的一致性。全球有大量的中后台产品都是使用 Ant Design 的设计系统搭建的,这意味着这部分界面的生产流程已经被极大的改变。除了让这些大众的设计系统被 AI 可控、稳定地“读懂”,我们也在探索如何“翻译”不同业务的设计系统让大模型理解。根据目前试验的进展,我相信这一天的到来不会太远。而当生成式 UI 技术既可以突破表达力的限制,又可以可控地遵循丰富多样的风格时,UI 设计领域的重大拐点已然到来。这意味着:• 大部分设计中需花费大量时间才能构建高保真界面的流程即将被彻底地颠覆。设计者的价值不再是操作设计工具进行构建,而是回归设计本身进行更多的思考、呈现更多的创意方案、推进更高质量的决策。• 过去多年,中大型设计团队花费巨量时间构建、维护设计系统以保持团队设计的一致性。当 AI 能以它的方式读懂并维护设计系统时,是否会产生另一类维度描述的“新设计系统”?它甚至在大部分时间里,不需要人为进行定义或维护。当下所定义的“设计系统” 是否会成为不必要的实践?这不仅是一个拐点,也将是一个全新的开始。自问自答和四种假设:AI 时代主流的「界面设计编辑器」是怎样的?大模型日新月异,产品设计与研发领域各种新的应用也层出不穷,身为“局中人”,我们几乎每天都在观察这个行业新的提问,并进行新的思考。这一章的开头,我选择使用自问自答模式,“由小及大”整理了几个问题,并提出我的看法。问题 1:Figma、妙多这类专业又精细化的界面设计工具,在 AI 生成迈过拐点后,会演进为怎样的形态?我认为会演进成“专业编辑器 + AI 助理”的一个普遍故事。我们已经看到,一个精细的文档编辑器加生成式 AI,使 AI 成为了你的文档助手,Office 称之为 Copilot,Notion 则拟人化地展现助手形象。IDE(Integrated Development Environment)是程序员日常使用的代码编辑器,VS Code 加上 AI 后,演进成了 Cursor。在这些例子中,原有的专业编辑器加入 AI 后,并没有被削弱,而是增强。本身拥有专业编辑器技术壁垒的玩家并不多,竞争有限,他们可以依靠 AI 提升的用户价值形成商业增值,或是打造一款新的产品。我觉得界面设计领域也会演进到这一步,AI 会成为界面设计工具中的个人助理,如果产品做得好,它甚至可以无处不在。不过似乎“个人助理”的显性化在这个领域发展要慢一些,原因可能包括:本身拥有精细化编辑器的玩家不多,以及界面设计领域的生成式 AI 要理解和输出的格式不如文字、代码这么直接。妙多正向这个方向演进,新的形态应该很快就会面向用户。我觉得专业编辑器更长远的竞争也会聚焦在 AI 能力,以及 AI 和专业编辑场景的融合。商业上,只依靠专业编辑器本身的壁垒获得长期利润的预期会下降。开源会极大促进这个方向的繁荣,例如,如果不是因为 VS Code 开源,也就不会有 Cursor、Windsurf。问题 2:界面设计工具领域会出现如 Devin 一样的 Agent 吗?虽然短期有各种挑战,但保持乐观,或许产生变化的那一天不会太久。由于 Agent 需要相对闭环地完成一个场景下的任务,人们对专业领域的 Agent 的完成质量预期比通用领域高很多。换句话说,通用领域的 Agent 或许只需要一些场景完成质量比 80% 的泛受众好,它就产生可观的价值(有一类说法是覆盖 90% 的领域,代理 90%的人的 90% 工作,这就是 AGI);但在专业领域,比较对象发生了变化。如界面设计的 Agent,它可能需要完成一个任务的质量超过 80% 专业设计师才算良好。Devin 面临同类的挑战。另一方面,界面设计 Agent 最终交付的产物大概率和设计师一样,需要交付到专业的设计工具上,因此 AI Agent 也需要掌握使用专业设计工具。虽然 Figma、妙多这些闭源产品可提供 API 在画布上创建设计,还有 Penpot 这样的开源产品,但开发者需要深刻理解界面设计的领域知识才可上手构建 AI Agent 。这种理解上的门槛也可能会延缓这个领域的进展,或是开发 Agent 仍是拥有专业编辑器玩家的特权。当然,这个领域的思考和探索会非常有趣,Agent 也可以先从相对简单可行的任务开始。例如我们最近就在思考能否做一个 Agent,完成设计领域的调研,并让 AI 直接将调研结果呈现在妙多上。问题 3:当我们去看一个更通用的“设计类产品” PowerPoint 时,微软加入 AI Copilot 后使之增强,但似乎并没有赢得广泛的好评。反而是这个领域 AI Native 的产品,例如 Gamma,它颠覆了 Presentation 的创建流程,也迅速获得了用户和口碑。下一代界面设计工具会是一款颠覆 Figma 的 AI Native 产品吗?这是个值得长期思考和观察的问题。作为 Figma 的挑战者,妙多起初花了两年时间去打造一个能和 Figma 在功能和性能上相当的界面编辑器,然后我们期望 AI 赋予我们机会做出越来越差异化的产品。严格定义下,我们不是一款 AI Native 的产品。另一方面:• 有产品设计想法的人如此之多,他们都需要这么复杂的编辑器吗?——我经常听到身边的产品经理抱怨 Figma 或妙多的编辑器上手门槛高,甚至要系统地学习两天的视频课才算入门。• 当设计者意图上希望用“五彩斑斓”的渐变色作为界面设计背景时,他们究竟是需要一个复杂的渐变色设置面板,还是只是期望挑选酷炫的设计结果?• 世界上的界面大多是“演进”而创造的,有多少界面设计工作一定需要从 0 到 1?以上这些问题都导向了一款 AI Native 的产品设计工具是可能的。事实上,我们可观察到很多 AI 创业团队的产品经理已经直接使用 V0 进行产品界面的设计。Lovable 这类产品虽然最终目标是生成应用,但它们给出大量的使用案例都是在生成产品设计原型 —— 有意思的是,Lovable 团队自己说他们最终大部分 Coding 的完成还是在 Cursor 上。它们现在共性的问题是,当用户对生成结果需要进一步修改时,仅仅依靠 AI 对话编辑是不便利的。我个人看法是:一类 AI 技术的变化在同一时间赋予了两种机会:第一种是原有的界面设计工具可以在 AI 加持下增强;第二种是 AI Native 重新打造的产品和工作流,对某类用户、某些场景的效率更高。前者会被后者在效率革新上冲击,但后者也会因为“不易精确又完备的表达” 难以完成长途奔跑的最后一公里。拉长时间看,你甚至很难说两者会不会“相遇”:前者可以在融入 AI 后不断简化原有的产品形态,而后者则为了实现更广泛的需求需要完善精细化的功能。这件事对 Figma 或许有更大挑战,他们在协同时代积累的巨大用户资产可能会成为他们在 AI 时代简化的阻碍。问题 4:我们观察到 Vibe Coding 类工具的流行,例如, Bolt.new,Lovable 这类产品,当用户有产品设计意图后,能借助这些工具直接生成最终的应用。产品界面的设计似乎只是这些产品流程中的一个环节。以及,不少用户也在晒出通过提示词直接在 Claude 3.7 中创建精美的界面。这类直接面向最终结果的生产工具,甚至是基础模型本身,会不会更为“本质”,让最终的专业界面设计工具价值大大降低?首先,部分设计工具正从单点需求向一站式平台演进。例如,Bolt.new 支持从输入意图生成网站,并能实时编辑和部署。Figma 最近也被曝光出了一个“水下项目”,可以直接帮助用户搭建网站,我猜测这会是一个直接从设计到发布部署的产品,会和现在市面上 Webflow、Framer 这类产品直接竞争。Canva 最近发布了新能力 Canva Code。这个逻辑听起来有点新奇, 毕竟 Canva 以“大众版 Photoshop”著称,用于制作平面的视觉海报等物料。但这也不难理解,据我所知,部分海外设计师日常使用 Canva 来设计网站界面。哪里有界面编辑器,哪里就有把这些界面直接发布或是互动化的需求,平台响应需求、拓展功能也就不足为奇。我们可能忽略 Canva 现如今已是一个使用简单、却“并不简单”的界面编辑器。但是,这些“新物种”的出现究竟是刺激了新需求的产生,还是抑制了原有专业编辑器的场景?这个问题换个角度看,也在探讨“更通用会不会击败更专用”。历史上有一些有趣的例子。Sketch 在界面设计领域因为更专用,它抢走了 Photoshop 曾经在 UI 领域的市场,但 Photoshop 因数字化进一步深化发展得更大。Canva 是更通用的,但它似乎并不是去击败 Photoshop。Cursor 本质也是因为更专用,它和 Claude 某种程度相互成就——虽然早期也有很多质疑在说 Cursor 只是一个 Claude 的“套壳”,但我相信这样的声音越来越少。更专用的工具可长期存在,是因为“专业用户”的存在。随着技术发展,“专业用户”鲜有最终消失,但专业用户群体的定义可能因需求变化而变化。“专业用户”长期存在背后更本质的意义或许在于:他们所从事和追求的工作,是否代表人类在不断追求更完美、更好。似乎“设计”也属于这类无止境追求的工作之一。此外,产品设计领域还有一些其它属性的问题:• 人们在做产品设计时,究竟是针对产品原型进行讨论从而达成共识更为敏捷,还是针对可以运行的应用进行讨论更为充分?• 如果生成式 AI 让今后大部分的产品设计基于“生成—选择—生成式编辑”,那些跳脱传统的设计方式或风格该如何达成?那些“匠人精神”的手动调整式设计,虽然占比很小,但会不会成为产品设计最核心的价值之一?基于以上,我对界面设计领域长期存在有价值的专业工具是乐观的。结合对上面几个问题的思考,我们向大家分享一下妙多团队对未来的「界面设计编辑器」如何演进提出的四种假设:1)手动界面编辑器 + AI 助理:手动编辑器解决 70% 工作,AI 助理解决 30% 工作。2)手动界面编辑器 + AI 助理:手动编辑器解决 30% 工作,AI 助理解决 70% 工作。3)一种更为简化的 AI 原生的设计编辑器,AI 生成和编辑解决 80% 工作甚至更多,手动编辑解决剩下工作。4)几乎不存在独立的界面编辑器工具价值了。界面编辑器只是一站式 AI 原生的应用生成软件的一个功能。• 假设 1:这像是我们对 Figma 和妙多未来的预测,AI 若能占比当下生产流程中 30% 的生产力,就已是一次颠覆。• 假设 2:假设 1 的更乐观版本,它的终极目标是 AI 助手也是一个专业 Agent,它能代理大部分的设计工作并在设计工具中呈现。也有另一个视角,如果我们观察 Wix,Webflow 这类传统的建站工具,界面编辑器本身是他们的一部分且面向非专业用户,它们在界面编辑器这部分被 AI 融入的占比理论会更高。• 假设 3:一种新的定义,近半年涌现的创新产品有很多。我们看到 V0, Magic Patterns,Onlook 都处在这个定义下的雏形阶段,虽然瞄向了截然不同的发展方向。• 假设 4:可能是 Replit,Lovable,Bolt 这类产品所追求的“终局”。我们并无法线性地演绎未来,发展之中有诸多变量。以上四种假设也不是非此即彼,这四种形态的产品可能会同时存在和演进。而有趣的是,我们正参与其中,我们既是这个演进中的变量,又可以观察和思考它们长期在界面设计领域的占比变化。设计与研发的角色的变化,未来的我们是谁?最后,我们从技术和工具的视角回归到生产者本身,观察产品设计和研发领域的生产流程从过去到现在的变化,以及趋势。上图展现了一个“古老”的产品研发团队的分工模式。我们用一个通俗的例子来解释他们的分工与协作——想象你最常用的打车软件的首页:• Product Manager(产品经理):用户在叫车时有哪些核心需求?我需要哪些功能或是元素满足这些需求?• UX Designer(交互设计师):用户要开始叫车了,如何让用户轻松又明晰的操作?输入地址的输入框要放在屏幕什么位置?如何让用户更容易确认出发的精确位置?• UI Designer(界面设计师):界面中的卡片需要怎样的阴影呈现什么样的风格?地图上当前位置的展示用什么形状和颜色更适宜?我的 icon 应该使用线性还是面性?• Frontend Developer(前端工程师):他们都催我何时开发完成上线……如今还在这样分工的团队已经不多了。过去 10 年,这种传统分工发生的最显著的变化是 UX Designer 和 UI Designer 的“合并”。现在大部分的产品设计师的职位称呼都统称为 UX Designer,或是使用更概括的称呼:Product Designer。“合并”直观的代表了产研领域分工的变化。例如 UX Designer 和 UI Designer 的合并背后,我认为本质上深受“设计系统”普及化的影响。对应也有两种说法:• 说法 1 “设计统一论”:可能是更普遍的说法。原来大多数 UI Designer 日常处理的问题,是一种边际产出,这些边际被逐步被固定为了设计系统中的规范。因此,UI Designer 那部分工作更少被需要,只需要 UX Designer 懂得如何运用设计系统即可。这种说法支持设计系统促进了界面设计领域的效率。• 说法 2 “设计消亡论”:与 1 相反,认为 UI Designer 在视觉上的创造性更大,无法被固定化的价值更大。而 UX Designer 则是在不断用重复性的交互方案解决类似问题。这个逻辑也对应了行业中对设计系统的批判:在设计系统越来越固定化的今天,设计师变成那些只会拼乐高的人,“真正的设计”走向消亡。“设计统一论”一定程度表明了随着工具的发展,原有生产流程中由人完成的“不确定性”的边际产出,变成了工具可支持的“确定性”的固定产出,从而人在使用工具后,能力边界被拓宽,“多能”胜过了“单能”。Noah Levin(Figma 的 Design VP)用形象的图例,表述了趋势的变化:可见,在技术巨大的变革下,分工后的具体岗位职责非常脆弱。假设我们将产品研发比作要建造一栋房子,我们宏观的概括现在产品研发领域的分工,我愿用“3D”来简述:• Definer:这座房子满足用户什么需求?为什么可以创造价值?如何获得利润?• Designer:如何让居住者有更好的居住体验?如何让这座房子的外观和内部都更漂亮?• Developer:如何规划和实施建造这座房子?“3D”一定程度对应了 Noah 图例中的 PM,Design 和 Eng。而这“脆弱”的分工方式,未来又会如何呢?对应“设计统一论”,工具会提供越来越多“确定性”的能力。未来的 Maker 有能力一个人完成一站式的定义、设计、开发。他们可能来自于“3D”中的 Definer,Designer 和 Developer 任何一方,唯一重要的是 Maker 们都需要善于使用最先进的、可提供“确定性”的工具。而“设计消亡论”,则让我们反思:当工具提供太多“确定性”时,人类追求更美、更好的创意是否会被抹杀?在我描述 “3D” 角色中,似乎越靠前的角色需要越多的创意,面临更加“不确定性”的工作。而这类面对 “不确定性”工作的能力,是否会成为 AI 时代最重要的反脆弱能力?毕竟,人们会想方设法的用 AI 逐步代理那些“确定性”的工作,而面向“不确定”的能力可能是我们区别于 AI Agent,可坚守价值的最后阵地。这篇文章是妙多的 Co-Founder 昊然对 AI 如何改变 UI 领域的最新总结和感悟,首发于 “海外独角兽”。本文转载自微信公众号「海外独角兽」(ID:unicornoberserver)作者:张昊然,妙多 Co-Founder编辑:Cage,海外独角兽 AI Research Lead

一、一句话概述Napkin.ai 是一款基于 AI 的可视化笔记工具,通过自动将文本内容转换为图表、流程图和信息图,帮助用户快速创建演示文稿、博客和社交媒体内容等视觉材料,提高工作效率和创意输出。二、取名灵感Napkin——餐巾,许多伟大的产品的想法在早期见投资人的时候都是诞生于一张餐巾,比如亚马逊、皮克斯,还有创投圈津津乐道的张一鸣见王琼画下的头条产品原型餐巾。Napkin这款产品正是致力于将你的知识、想法、商业故事进行可视化表达,这个名字取得可谓是精巧。亚马逊“飞轮模型”Twitter创始人Jack Dorsey分享的雏形三、Logo结构上:像是被对折起来的条纹餐巾,呼应名称Napkin(纸巾),同时条纹化让整体餐巾结构更加清晰简洁颜色上:有黑白灰和彩色两种颜色,前者的应用场景主要为产品使用网页界面,在表达logo同时减少视觉阅读负担;后者则多用在领英、油管等社交媒体平台,多彩吸引用户注意力,留下印象,便于品牌传播四、slogan“The visual AI for business storytelling”(面向商业故事的可视化 AI),强调其帮助用户通过生动的视觉内容讲述商业故事的能力。五、功能拆解文本转示意图:将用户输入的文本内容自动转换为图表、流程图和信息图等视觉元素。有限自定义编辑:提供可编辑的视觉内容,包括图标、装饰、连接线等,让用户的创作更加个性化。图片搜索:提供在线图片搜索功能,帮助输出文档时更快速找到插图多格式导出:支持将最终的视觉内容导出为 PNG、SVG 和 PDF 格式,方便在不同场景中使用六、盈利模式订阅制:提供基础功能免费使用,高级功能(暂时免费)需要订阅。企业解决方案:针对大型团队和企业客户的需求,提供定制化的服务。(目前暂未推出)。七、不足之处和迭代方向输出局限性:目前 Napkin.ai 主要专注于将文本转换为图形,对于更复杂的可视化需求可能无法满足。语言和字体拓展不足:当前输出的可视化图形无法进行英文以外的语言以及字体更改功能扩展:增加更多的可视化类型,如表格、思维导图、甘特图等,满足用户更广泛的需求。素材库不足:无论是搜索功能出来的图片数量和质量还是现存的各类template数量都不足,将输出感觉精准和多样,是当前的P0任务。八、战略方向跨平台支持:目前Napkin只支持网页端,但是甚至手机网页端都无法使用。可以考虑开发移动端APP以及浏览器、office插件。绑定营销:可以和Notion、Grammarly这类文字效率工具产品进行合作,成为其插件或者共同的MKT合作宣发,实现流量互惠。多元商业化:付费组件打造,针对设计师、商业分析师、财务人员等可以推出单独的付费定制化template模组组件。开发者生态构建:推出开发者社区,让开发者可以自己上传自己设计的template到社区供大家使用,并且为创作者提供回报。以上内容来自互联网,侵权必删。

Agnes 是一家总部在新加坡的 AI 创业公司,我觉得可以把它简单理解成 AI 原生的 Office。现在我们看到的大多数 Office 套件,基本都是在旧有流程和界面上叠加一些 AI 功能,而 Agnes 则是从零开始,把信息的获取、整理、生成、表达,以及多人协作的方式,都重构成适配 AI 时代的工作流。在前段时间的世界人工智能大会上,Agnes AI 创始人 Bruce Yang 说,他们想做一个 AI Agent 驱动的工作空间。现在的大多数 AI 工具,或者只能处理单一任务,或者是在旧流程中加个 AI 按钮。这样的工具无法贯穿整个工作流程,更谈不上沉淀团队知识和上下文。Agnes 要做的 Agentic Workspace 是一个具备记忆、上下文和目标的完整工作环境。不同于传统 AI 工具只被动响应用户需求,Agnes 能主动跟进项目进度,跨任务维护和共享上下文,不仅包括最新内容,还涵盖项目背景、决策过程、引用资料及任务状态。系统会自动记录和同步这些信息,确保团队成员能够随时无缝融入工作流程。比如在制定一个市场方案时,AI 会先收集并整理调研信息,生成结构化资料库,再自动生成包含主题视觉元素的 PPT 初稿。进入协作阶段,AI 还清楚每个人的分工与进度,能整合修改意见,推动版本收敛到最终成稿,真正实现人机并行协作推进项目。这款产品除了用 AI 重塑流程外,还有一个很有价值的创新:团队之间可以共享 AI 的上下文。过去像 Google Workspace 或飞书文档这样的协同工具,核心是共享文件,让多人实时编辑、评论、修改。但它们传递的只是文件本身,缺少背后的语境,也就是 Context。在真实的工作中,Context 决定了协同效率。就像字节强调的那样,Context not control。Agnes 的做法是让 AI 持续维护这些上下文,并在权限范围内向团队共享,让信息和背景始终连贯。这样无论是新成员加入,还是任务跨阶段切换,所有人都能在同一个语境下推进工作。说实话,看了这么多 AI 产品,生成 PPT 和研究报告的不少,像 Agnes 这样在工具整合和协作逻辑上下功夫的产品,很少见。Agnes 团队的判断是,接下来 Office 的范式,应该是 AI Agent 驱动的工作空间。这个理念可能现在听起来还是很前沿,但就目前 AI Agent 的发展速度来看,很快大家就会理解它的真正价值。 最近,Agnes 上线了两个功能:Deep Design 和 Wide Research。先说下 Deep Design。要理解 Deep Design,得先说说 Agnes 的 AI Design 功能。AI Design 本质上就是图片生成,这项功能并不新鲜。不同的是,Agnes 把文本理解、多模态输入、样式迁移和局部微调等原本分散的能力整合在同一个协作画布里,让它们能够在统一的上下文中协同工作,让创作更高效。而 Deep Design 是对 AI Design 的全面升级,不仅继承了图片生成等基础能力,更实现了从生成到审核、反馈再到优化的全流程自动化。具体来说就是,Agnes 会在生成图片后自动进行多维度审核,比如布局是否合理,光影是否正确,画面与描述是否一致等,并给出具体的可执行的修改建议。随后,Agnes 根据反馈持续优化图片,反复迭代,直到最终生成 Agnes 自己满意的结果,才会输出给用户。Wide Research 则是面向信息检索和分析的,它一次能启动数十甚至上百个全功能子代理,并行分工处理同一个任务,把原本需要串行完成的研究拆成可以同时推进的小步骤。比如要对上百个选项做比较或从海量信息源收集资料,它可以在几分钟内完成并整合结果。下面是我分别做两个 Demo 帮大家理解。我告诉 Agnes 帮我做五张纪念科比的海报。Agnes会根据我的需求先出了一份设计构想,把每一张海报要展示什么内容给我罗列出来,让我看是否满意。如果满意点击“Go”它就开始工作了,如果不满意可以在对话框中继续输入需求。其实到这儿Agnes和我们平时用的其他 Agent 差不多,都是这些步骤。Agnes的特别之处是从点击“Go”后提现出来的。点击“Go”后,Agnes会调用 Plan Schedule 工具创建了一个项目,并在项目介绍中告诉我,完成这个项目要先由设计师提供设计指导,再由视觉生成器根据设计师的指导创建海报。接着调用 Visual Principles 工具,做设计指导。设计指导写的特别详细,包括海报风格、字体、构图、配色、代表含义都写的清清楚楚。设计工作完成后,调用 Batch Visual Generating 工具开始生图。注意,Agnes 生图是并行操作的。这样用生一张图的时间就把五张图全部生成了,节约了很多时间。每生成一张图片 Agent 都会对图片从专业角度进行评论,会写优点,也会写缺点,还会对图片打分。看评论 Agent 对这张图比较满意,得分是 89。下面这张图 Agent 就不太满意,指出了图片中人物面部特征和实际人物有差异,设计风格不明显等问题,最后打分是 78。在所有图片都做好之后,它会把自认为不满意的图片,重新生成一次。每生成一次就自动评估一次,如果不满意就继续修改。每一轮都给出了两张图片,然后 Agent 会根据自己的专业标准,对这两张图片分别打分,并选出一张评分高的给到我。整个过程大概用了 3 分钟,我只需要给 Agnes 一个需求,中间环节包括设计规划、生成图片、图片评分、指出缺点、提出修改方案、修改图片,全部不用我操心,我只需要等着看最后输出的图片就可以。我觉得整个的生成流程,最核心的亮点还是 Agnes 真正让 AI 从简单的生成迭代为了和人协同的生成,这应该才是一款 AI 产品的终局。因为工作场景中,生成不是随性的玩,而是要结合企业的需求,按照正确的流程一步步产出正确的结果。这中间,人的参与,人的判断必不可少。接下来,我们再看看 Wide Research。Wide Research 能自动调度大量 Agent 并行分工,将复杂的任务拆分为多个子任务同步执行,并最终整合结果。同样的任务我分别交给 Deep Research 和 Wide Research。Deep Research 是这样工作的:Wide Research 是这样工作的:明显能看出区别。Deep Research 采用串行处理方式,任务需要一步步依次完成,效率有限。而 Wide Research 能够将十几个子任务同时并行推进,速度提升非常明显。而且 Wide Research 生成的内容质量明显更高。它能同时调动多个 Agent 并行检索不同领域和信源的信息,并将结果进行整合。这样不仅让知识获取更加全面和及时,还能根据实时信息灵活调整研究方向,避免因单一路径出错而导致重复返工。在 Agnes 中,这些生成的内容都不是独立的,比如可以根据 Wide Research 生成的内容直接做图。也能直接做 PPT。Agnes 真正实现了一体化的 AI 工作流,无论是内容生成、图片创作还是 PPT 制作,都可以在同一个平台上完成,省去了频繁切换应用和手动搬运内容的麻烦。现在有两个趋势越来越清晰。第一个是多 Agent 并行协作正在成为标配。像 Wide Research 这种,一次调度几十甚至上百个智能体分工协作、传递上下文,把大任务拆成可同时推进的环节,让复杂问题的解决速度和质量同时提升。第二个是 AI 系统必须具备自我进化的能力。它们不再只是一个固定功能的工具,而是可以自我学习和改进的系统。AI 应用的竞争会转向真实场景落地:谁能把 AI 放到复杂、真实的业务流程里解决问题。Agnes 的设计也是对这两个 AI 应用趋势的最好诠释。我觉得做 AI Agent 的朋友,可以看看他们的思路,确实有很多理念上的创新。另外,和很多 AI 应用不同的是,Agnes 在底层技术上也有不少颇具前瞻性的设计。它不是简单把模型和功能组合到一个界面里,而是从架构层就考虑多 Agent 协作、上下文沉淀、工具调用和结果验证这些环节如何无缝衔接。比如上个月,他们曾经发布过一篇论文,谈到了怎么优化 Token 的使用效率。在一个变化越来越快的行业里,这些底层选择或许会决定谁能在几年后还留在牌桌上。以上内容来自互联网,侵权必删。

MiniMax近日宣布推出Agent全栈开发功能,声称用户只需一句话描述需求,就能生成包含前后端的完整网站应用。这个功能不仅支持基础的网页展示,还能处理支付、数据库、定时任务等复杂功能。

近日,协作设计软件公司Figma在纳斯达克成功上市,首日股价飙升逾250%,创下了美国资本市场的新纪录,成为史上首个募资超5亿美元且首日股价涨超三倍的大型IPO。此次上市不仅让其估值实现巨大飞跃,也再次将这家设计新贵推向了行业焦点。Figma的崛起,本质上是一场对传统设计工作流的“云端革命”。革新用户体验:告别“孤岛工匠”,拥抱实时协作在Figma出现之前,设计师的工作体验犹如“孤岛上的工匠”。他们必须配备专门的电脑,因为像Photoshop和Sketch这样的专业软件不仅安装困难,还经常出现问题。设计文件的每一次修改都可能是一场“大灾难”,版本管理更是专业技巧,例如“最终版_V3_最终确认_修改版.psd”的命名曾是每个设计师都深有体会的痛点。Figma的两位创始人Dylan Field和Evan Wallace在2012年获得了彼得·蒂尔的Thiel Fellowship基金投资后创立了公司。受Google Docs实时协同理念的启发,Figma将矢量编辑完全搬到浏览器端。这意味着用户无需安装复杂软件,只需一个浏览器即可进行设计,并实现跨平台无障碍操作,同时享受实时云端存储和分享的便利,大幅提升了团队协作效率。这种变革不仅是效率的提升,更是工作范式的彻底改变。设计从过去“单人完稿后交付”的封闭环节,转变为产品经理、工程师、运营人员都能实时共同创作的开放起点。这种独特的“协作网络”构成了Figma最重要的“护城河”。它让Figma不仅仅是一个简单的设计软件,更是许多公司生态的“基础设施”。Figma的用户数据也充分验证了其广泛的吸引力。截至2025年第一季度,Figma的月活跃用户已超过1300万,其中高达三分之二的用户并非专业设计师。它已成为产品经理的“Google Docs”、工程师的代码规范库、市场团队的创意白板。Figma甚至被打趣地称为“最适合写字的人用的设计软件”。在商业模式上,Figma采用了“免费增值”(Freemium)模式,个人和小团队可以免费使用基本功能,而大型企业则付费订阅高级版本。这一策略极大地降低了新用户的采纳门槛,使其在设计师群体中实现了“病毒式传播”。2020年疫情期间,居家办公的兴起更是催生了对远程线上办公的巨大需求,Figma的云端协作功能因此成为“刚需”,用户数量激增,估值也随之水涨船高。AI时代下的“危”与“机”:Figma的战略布局当AI浪潮以摧枯拉朽之势席卷而来时,许多人担忧Figma的“护城河”是否还能稳固。AI确实正从两个维度改变设计工作的本质:效率工具:AI能够自动完成命名图层、生成设计规范等重复性劳动。创意伙伴:AI可以根据简单的指令(Prompt)生成多种设计原型。这看起来似乎在“掏空”Figma的核心价值,但王煜全在前哨科技特训营中提醒大家:对于Figma这个已经走在“产业颠覆”道路上的新玩家,AI更多是助力,而非敌人。Figma认为,AI正在急剧降低“设计”的门槛。过去只有专业设计师才能使用复杂的软件,而未来,一个产品经理、一个创业者、一个营销人员,只需用自然语言描述想法,AI就能帮助其将想法快速视觉化。Figma CEO迪伦·菲尔德将这种影响类比为PPT和Word的出现:它们并没有让专业作家和演讲者失业,反而让“文档撰写”和“演示汇报”成为所有白领的基础技能。同理,Figma的目标是让“视觉化沟通与设计”成为每个人的基础能力。这是一个比专业设计师市场大百倍、千倍的“大设计”市场。AI实际上为Figma带来了数以亿计的潜在新用户。面对这个宏大的未来,Figma早已布局。它推出的两大AI功能——Dev Mode和Figma Make,清晰地展示了其管理层眼中的进化路径。Dev Mode:面向专业开发者,旨在帮助他们完成更精确、系统的开发任务,并能从设计稿直接提取代码片段,加速设计到开发的衔接。Figma Make:则面向“纯小白用户”,其口号是“你不需要懂设计、不需要写代码,甚至不需要画线框图,只需要一个idea,我们帮你变成网页/原型”。这项功能旨在帮助用户绕开前端设计的编程代码和设计规范。Figma解释,他们不仅将AI大模型引入平台,还构建了MCP(一种架构层优化),让AI能够真正“看懂”设计稿并生成结构化代码。Figma的AI战略展现出其成为“下一代生产力平台”的雄心。它没有选择转向模型或生成类产品,而是坚定地扮演“工作流基础设施”的角色——提供结构,而不是内容;搭建平台,而不是限定结论。通过不断完善FigJam和Figma Make等功能,并将AI能力逐步内嵌到产品结构中,Figma所面向的人群正变得更加宽泛,包括产品经理、开发者、运营人员、内容创作者等。尽管面临一些“迟到者”的质疑和早期演示中的小插曲,但Figma通过其对用户反馈的重视和持续的战略定力,正努力在AI时代开辟其新的增长曲线。Adobe曾计划以200亿美元收购Figma,但因反垄断担忧最终作罢。这次“失败的收购”反而极大利好Figma,因为它让资本市场看到了Figma已成为行业**“事实上的平台标准”**。Figma的独立上市和其对AI的深远布局,预示着它未来的故事绝不仅仅限于一个“工具公司”,而将拥有更具想象力的叙事。