a16z合伙人:看过上万个产品后,总结出的9条“留存定律”

用户留存率下降如同物理定律,不可逆转。a16z合伙人Andrew Chen基于十五年数据指出:当D1留存低于40%时,任何推送或A/B测试都无法挽救,这证明产品本身未满足真实需求。唯一出路是彻底转型,而非表面优化。留存受品类天性制约,且规模扩大会稀释用户质量。真正的高留存奇迹,源于在正确时机重新定义旧需求。

作者: 久谦资本
分类:业界新闻
47 次阅读

每个创业者都经历过那一刻:产品上线、数据刺眼,留存率一路下滑。于是团队开始疯狂加推送、做活动、调文案,希望“救活曲线”。但几个月后,曲线依旧沉默,融资窗口却悄然关上。——问题从来不在通知频次,而在用户根本不想回来。十五年里,无数创业公司重复同一个误区:把留存当成“运营问题”,而非“产品真相”。

留存率其实是一种残酷的物理定律——它只会往下掉,永远不会神奇反弹。越早理解这一点,越能把时间花在正确的转型上。

本文将拆解“留存的自然法则”:为什么坏留存救不活?为什么规模越大反而更糟?以及,为什么真正高留存的产品,都像被赋予了某种魔法。


【读书笔记】

1. 坏留存无法靠微调修复,唯有彻底转型(Pivot),若 D1 留存低至 10%,意味着产品本身无需求。通知、推送、A/B 测试等战术优化顶多提升 10 个百分点,无法“救活”曲线,真正的改进需从根本重构产品结构、使用场景与定位方式

2. 留存曲线遵循“半衰期”规律,下降是自然趋势,多数产品呈现几何式下滑:D7 较 D1 降约 50%,D30 再降一半,最终趋近于 0 或维持 10% 左右,除非具备强网络效应,否则留存曲线几乎不会反弹

3. 使用留存会下降,但收入留存可能上升,用户数量会流失,但留下的用户往往消费更多,B2B 产品如 Slack 的企业账户会持续扩展使用场景,而消费产品如 Amazon、Uber 用户的消费频次与金额也随时间增长,形成收入留存上升的 LTV 曲线

4. 留存受产品类别天性限制,无法强求高频,留存的上限取决于产品类别与用户组成,协作、通讯、信息类应用天生高频,而酒店预订、健康管理等产品注定低频,当用户规模扩大,新增用户的契合度下降——早期自然增长的“黄金用户”最黏性,后期通过广告或国际化获得的新用户留存更差

5. 留存决定成败:病毒无用,魔法难造,高拉新 + 低留存的产品注定短命,真正的留存奇迹来自“时机 + 洞察”:Instagram 借鉴 Hipstamatic 滤镜,Google 在 Lycos 之后突破,Uber 将线下打车数字化——皆在旧需求被重新定义的窗口期出现,这类“末位行动者优势”不是偶然,而是对市场时机与用户需求的精准拿捏


本文编译自发布于2025年9月9日的Andrew Chen(a16z合伙人)的专栏,原链接:

https://andrewchen.substack.com/p/lessons-learned-from-staring-at-thousands

以下是原文的全文翻译,enjoy!

注:正文中标蓝部分为读书笔记的对应原文


【正文】

我已经盯着留存率(retention curve)的数据看了超过十五年。

我曾是创业者、产品经理,如今是一名风投。在 Andreessen Horowitz(a16z) 工作期间,我每年会接触到上百家创业公司,其中很多是通过我们的一项计划 a16z speedrun program(我们为全新初创公司提供最高 100 万美元的投资)。(顺便说一句,我们刚刚宣布了 2026 年的项目,现在已经可以申请了。)

但让我们回到留存话题。这些年,我看过成千上万条留存曲线。每当我评估一家新创业公司时,这是我最先要求查看的指标之一。我翻阅过无数数据室,分析过不同分群、不同口径下的留存曲线;作为一个构建产品的人,我也从另一端亲自体验过。我做过数百次 A/B 测试,写过无数版本的用户引导邮件、推送通知,只为“扭转那条曲线”。结果发现其中的规律几乎恒定。就像物理学有其不变定律一样,留存曲线也有某种“自然法则”般的模式,一次又一次地在不同产品中重现。

以下是我总结的几个“定律”:

- 坏留存是修不好的。不,增加通知不会救活你的留存曲线。你也无法通过无数次 A/B 测试把它变好。

- 留存只会下降,不会上升。而且奇怪的是,它以一种可预测的“半衰期”规律衰减。早期留存决定后期留存。

- 营收留存会上升,而使用留存会下降。好消息是:虽然你会不断流失用户,但留下的那群人往往会花得越来越多。

- 留存是相对的,与产品品类相关。有些产品天生难以“日活”。比如酒店预订应用 —— 抱歉,它永远不可能成为每日使用的工具。

- 用户规模扩大时,留存反而会变差。最好的用户来自早期的自然增长阶段,最差的往往是后期获客的。

- 流失是不对称的。失去一个用户要比重新赢回一个容易得多。

- 留存极难精确衡量。季节性是真实存在的。新实验、Bug、市场变化都会干扰数据。你无法永远等到 D365 才判断结果。

- 病毒式增长但留存糟糕的产品,注定失败。这个实验科技行业已经重复过无数次。

- 卓越的留存具有魔力。当你看到真正高留存的产品,它几乎让人惊叹。

接下来,我们将逐条深入探讨这些规律。


坏留存是修不好的。

这种场景你一定熟悉:你花了几个月开发一个新产品,终于上线了。结果,坏消息传来——初始留存数据糟透了。此时你已经在产品上投入了数月时间与成本,进退两难。于是团队开始集思广益:“怎么提高留存?”有人提议:加更多推送通知、提醒用户回来;有人说:添加更多功能,或对落地页做 A/B 测试提升转化。

你大概也知道,这样的故事通常如何收场。当产品留存本身不好时,几乎不可能“修好”。是的,你或许能做出一些细微改善,比如把 D1 留存率从 40% 提高到 50%,这还算可行。但如果你的 D1 只有 10%,那几乎意味着——没人真正想要你的产品。此时无论做多少 A/B 测试、通知优化,都不足以扭转曲线。更糟的是,由于开发周期长、沉没成本高,很多团队不愿放弃,只能“硬着头皮坚持下去”。然而,对大多数产品来说,更好的选择是——立即转向(pivot)。真正能“修好”留存的转型,往往意味着彻底的产品重构。举个例子:如果你原本的首页是一个信息流(feed),也许应该改成一个结构化、分步骤的操作流程。如果你原本强调“分享”,或许应该改成“创建和保存”。你甚至需要用完全不同的方式描述你的产品、重新定位竞争对手。这种调整必须足够大、足够彻底,才有可能改变留存曲线的走向。


留存只会下降,不会上升。

留存曲线往往遵循几何式的下降规律。例如,许多产品的曲线如下:无论 D1(首日留存)是多少,到了 D7 会下降 50%;无论 D7 是多少,到 D30 再降一半;再过几个月后,你可能剩下接近 0 的活跃用户,运气好的话还能保留 10%。

这是一种可预测的衰减模式。

而你永远不会看到这样的曲线:一开始高、后来低、然后又神奇地升高。——那根本不可能。换句话说,早期留存不好,后期也不可能变好。你必须从一开始就表现强劲,才能维持强劲。

当然,也有少数例外值得一提:

- 极度“硬核”的产品(例如在线扑克)。可能总体留存率不高,但留下来的那批用户非常黏性,且愿意持续花钱。这种模式是可行的。

- 具有网络效应的产品。新用户起初使用积极,但后来可能中途流失。然而,如果产品(如社交网络、协作工具等)能借助新用户的加入重新激活老用户,就会出现“曲线回升”的奇迹。这种情况极为罕见,但一旦出现,非常惊人。


营收留存会上升,而使用留存会下降。

留存曲线不仅能用于用户数量,也能用于收入。到目前为止,我们讨论的都是用户留存——它的特点是总会下降。而收入留存则不同——留下来的用户往往会花更多钱。这正是 B2B SaaS 产品最大的优势之一。比如 Slack。如果看用户群,留存曲线也会下降:有人用得多,有人弃用。但对于那些真正采纳 Slack 的公司而言,使用会自然扩散,来自该公司的收入会显著增长。于是收入留存曲线会上升而非下降。这种现象非常了不起,但遗憾的是,大多数消费类产品并不具备这种特性。这也是为什么 B2B 产品在商业模式上往往比消费类产品更具优势的主要原因之一。

消费者版的情况更像是亚马逊。最初你可能只买书和音乐,但随着功能扩展,你开始买更多类型的东西。于是单个用户在平台的生命周期价值(LTV)几乎无上限。Uber 也是如此:早期用户可能只坐机场线,后来变成日常通勤、聚餐出行。用户留存下降,但收入留存上升。


留存与产品类别相关。

我曾写过“留存的天性与后天”理论。现实是,很多产品的使用频率由天性决定。比如协作工具、代码类应用,你可能每个工作日都会用;而漏洞警报系统,希望你永远用不到。同样,新闻、社交、通讯应用是日常高频的;医学参考、天气、银行类则低频但稳定;游戏则高频但短命。

天性 vs 后天”告诉我们:许多新产品从一开始就没有机会。如果你开发一款“社交旅行应用”,问题在于——人并不常旅行。与其强行让它社交化,不如接受低频本质,通过掌控交易环节或延伸到餐饮夜生活场景(如 Yelp)来提高变现频次。对抗天性很难。你能做的有限。

因此,如果你想做高频高留存产品,最好选那些已是用户核心日常的一类。意味着你的产品若成功,一定会挤掉别的日常应用。难怪我用 ChatGPT 后,Google 搜索量骤减;开始用 Substack 写读博客后,我几乎不再用其他信息软件。


用户规模扩大时,留存反而变差。

假设你有幸打造出一个留存表现极佳的产品,

团队的自然想法通常是:“太好了!那我们把这一套成功经验复制到更大的市场去!”于是他们推算道:如果早期留存好、变现好、使用高,那只要放大规模,就能得到一个巨大的数字。但现实总是残酷的。当你扩大用户基数时,坏事往往开始发生。举个例子:当你把产品从 iPhone 用户扩到 Android,或拓展到国际市场,又或者通过付费广告等渠道获客,你会迅速发现:所有指标都在变差。

原因很简单:最好的用户总是最早到来的。他们通常具备以下特征:愿意付费、变现能力强;使用意图明确;技术熟练、数字化程度高。他们往往通过朋友推荐而来。而后期通过广告、渠道、国际化等方式获得的新用户,他们的行为、需求、支付能力都不同。结果就是:产品对他们没那么契合。一个典型例子:假设你原本为欧美大学生开发一款 iPhone 应用,当你把它推广到新兴市场的 Android 用户时,会发现功能需求、使用习惯、支付模式完全不同,最终,整体指标都会被“稀释”。当然,你可以不断优化、适配、改进,但我可以肯定地说:它永远不会回到原来的水平。

因此,真正的问题是:当你的用户群体扩张、留存逐步恶化时,这些用户是否仍然有价值?你的产品是否仍能盈利?你是否还能牢牢守住那批“黄金用户群”?这批最早、最忠实的用户,在业内被称为——“The Golden Cohort”。


流失是非对称的。

失去一个用户极容易,让他们回来极难。多数产品在前 30 天就流失 90% 以上的用户。重获流失用户几乎不可能,因此很多时候获取新用户比挽回旧用户更容易。这就是为什么“召回营销”(例如发优惠券、折扣邮件)通常痛苦又昂贵。真正有效的方式是让现有活跃用户自然带回流失用户。比如某人试过你的项目管理工具但弃用,与其发一堆提醒邮件,不如让他的同事邀请他一起做新项目。这才有效。但这种机制极其复杂,仅适用于具有网络效应的产品(如协作、分享类)。


留存难以衡量。

当人们谈论留存时,他们往往关注的是第一天、第一周或第一个月的情况。但很少有人会讨论两年之后会发生什么。原因在于,当你在开发一款产品时,需要一个足够短、且容易测量的时间窗口,让团队能够根据结果快速做出决策。结果是,虽然年度流失率(annual churn)或长期变现能力(long-term monetization)极其重要,但大家往往不会去测量这些长期指标,而是专注于眼前可见、易于追踪的短期数据。然而,这种做法存在很多问题。

不幸的是,许多产品类别都具有强烈的季节性波动。凡是涉及电商、旅游、健康管理或线上约会的产品,都是显而易见的例子。甚至企业软件的使用方式也存在周期性变化。季节性会严重干扰留存分析:比如你可能发现环比或季度留存下降,但这到底是因为你推出了新功能导致的,还是仅仅因为这个季度用户行为自然不同?当数据存在严重滞后效应(lag)时,留存率就变得很难衡量。

同样地,程序漏洞(bugs)、正在运行的 A/B 测试或新市场的上线也都会扰乱数据。你会发现,团队在查看留存报告时,曲线可能上升或下降,但每个数字旁边都有一个星号(*),表示这个结果需要谨慎解读——因为大家都在试图确认,新版 Android 的上线是否让数据失去了可比性,变成了“苹果对橘子(apples-to-oranges)”的比较。


病毒式增长+差留存=失败。

很多新产品团队过于关注拉新而忽略留存。只要图表往右上走,看起来都好,于是大举烧钱获客、先融资,留存问题“以后再说”。

如今这种现象在 TikTok 推动下屡见不鲜——一段爆款视频或创作者推广带来数百万下载,但使用率与留存糟糕。

科技行业已经重复做过无数次实验,结论一样:高病毒+低留存的产品不会长久。因为留存难修,热度一退,就剩“拉新差+留存差”,终将坍塌。

早期社交网络时代便如此。许多产品靠通讯录 spam 拉新,用户体验糟糕。只有 Facebook 借助信息流(The Feed)与实名制(Real Names)等创新,实现了“又爆又留”。移动互联网时代同样如此——强制邀请能带来短暂高峰,但若产品不够粘性,很快崩盘。


高留存是一种魔法。

也许读到这里你会有些沮丧。确实,要让产品“留得住”非常难。但当你遇到真正做到的产品,那简直神奇。当我偶尔见到 D30 留存高达 50% 的产品(大约每两三年一次),那感觉令人震撼。我渐渐相信,这种“瓶中闪电”式的成功,不是靠无数 A/B 测试或高速迭代得来的,而是某种市场或用户洞察的魔法。这种洞察看似简单,却第一次精准满足了需求,从而驱动超高留存。视频会议、阅后即焚照片、智能对话 AI(能即时回答任何问题),这些产品都带有那种“魔法”,不是数据驱动能造出来的。


真正的问题:那该怎样才能拥有高留存?

看到这里,你心中可能仍有个巨大的问号:那么到底该如何实现出色的用户留存?(如果我能给出确凿无疑的答案,身为初创企业投资人的工作岂不是轻松多了?)

但让我们尽力探讨。在我之前的观点中,其实暗藏了一些线索:

- 创意理念至关重要。

- 若想打造高留存产品,必须选择本身具备高留存特性的领域。

- 你需要选择那些你每天都在使用现有产品的赛道。

- 然后构建直接与之竞争的产品。

- 若你胜出,用户便会弃用原有产品而转向你的解决方案。

这个标准很高,但我认为这是个良好的起点。

当然,如果你打造的产品与现有产品正面竞争,可能会有人反驳:"要让用户转换选择会非常困难。"确实如此。此时就需要你决定承担足够的市场风险,但必须是适度的风险——通过推出新颖独特的方案来重塑核心交互模式。不过这种创新更可能是20%的改良重组,而非80%的颠覆。理想情况下,你需要在用户使用前60秒内,以他们能够快速直观理解的方式阐述这种创新。

这正是那个令人头疼的投资者问题"为什么是现在?"显得尤为关键的原因。因为你所要说明的是,理想情况下行业出现了某种新变革——无论是像LLMs这样的通用技术,还是像社交媒体过度饱和这类社会变迁——让你恰好能在此时实现这种产品转型。

这能助你快速切入现有市场,更有可能在早期获得亮眼的留存数据。时机选择至关重要。如果时机把握不当,进入的是低关注度领域,且产品差异化不足,你就会发现留存问题转化成了用户获取难题。开发新型网络浏览器的困境正在于此:若成功,用户粘性极高;但人们已满足于现有浏览器,初期说服他们尝试新产品的成本高昂且复杂。

这正是为何我从不指责那些提出"某领域的Cursor"或"某行业的Figma"创意的人,就像上一代"某领域的Uber"概念一样。他们试图借助现有市场和行为模式,避免承担过高的市场风险。

只要差异化定位准确、时机把握恰当、存在大量用户需求,且找准了基础产品类别,这种策略确实能奏效。


但新兴市场又如何呢?

自然的反驳点是:新市场往往比现有市场更令人振奋。科技的本质不正是创造全新事物,而非对旧事物进行20%的改良吗?这固然正确,但我认为这类产品只占极少数。

对此我的回应是:大多数产品实际上都有其前身谱系,即便这些前身已被快速遗忘。Instagram之前有Hipstamatic——它曾是早期App Store最畅销的付费摄影应用,证明了滤镜功能的商业价值;谷歌并非首个搜索引擎,在Lycos、Excite、Infoseek等先驱之后,它大概位列第十,这些先驱证实了搜索需求存在但难以变现;特斯拉不是首款电动车,iPhone也不是首款智能手机。有时候,第十次迭代才是关键。有人称之为"末位行动者优势"而非先发优势,这个观点很重要。

当然偶尔也会有真正的新事物诞生。Uber的诞生是将线下现有行为——叫出租车——转化为应用,而非因为当时已有非常成功的网约车应用(Lyft当时还是个奇怪的巴士预订平台)。OpenAI的ChatGPT从构思到真正引爆市场的v3版本历时五年,期间没有任何可替代的参照蓝图。这类探索弥足珍贵,科技行业因此得以进步,因为它们在新品类创造过程中承载着真实风险。





本文由公众号“久谦资本”授权转载| https://mp.weixin.qq.com/s/qUPVC-_xlzx_AexxhjOvFw |(编辑:ZN)


ceb3ac6b9b8dd06f5f6ff80d114e5f3.png

⬆ 扫码加入AI产品交流社群,你有机会得到:

- 最值得关注的AI产品;

- 最新鲜的 AI 产品资讯;最实用的AI产品使用经验;

- 还有不定期赠送热门新品的邀请码、会员码。

评论 (0)

登录后即可发表评论

No data
暂无评论,快来发表第一条评论吧!