ITBear旗下自媒体矩阵:

a16z谈AI的「玻璃鞋效应」:大量模型都能把事情「勉强做好」,却没能够激发用户忠诚度

   时间:2025-12-30 12:37:49 来源:Z Potentials编辑:快讯 IP:北京 发表评论无障碍通道
 

Z Highlights:

现实中,大多数产品要么能力不足、要么方向偏离,或者只是并不适合要完成的那项具体任务。而那些价值极高、却始终未被妥善解决的问题——我们可以称之为尚未解决的工作负载——就像灰姑娘的脚一样,一直在等待那只尺寸、形态与用途都恰到好处的玻璃鞋。

产品从未真正找到产品—市场匹配。它几乎是在发布的同时,就直接进入了我们可以称之为“够用即可”的市场:在这个环境中,有大量模型都能把事情“勉强做好”,却没有任何一个能够激发真正的忠诚度。

归根结底,AI下一阶段的叙事,也许并不取决于谁的模型更大、更快。真正决定走向的,可能是那些能够理直气壮地说出这样一句话的团队:“我们找到了真正需要我们的那批用户,而且在四个月之后,他们依然还在。”

Malika Aubakirova是a16zAI基础设施团队的投资人,专注于人工智能、网络安全与企业级基础设施交叉领域的前沿技术,拥有后端系统、前端开发与SRE背景,长期从事高可扩展性、高安全性与高可靠性软件系统的构建。本文发布于2025年12月8日。

MVP、用户流失率,以及“老派SaaS剧本”

在传统SaaS模式中,早期留存经常是一场苦战。行业里形成了一套心照不宣的打法:先快速推出一个功能极简的MVP(最小可行产品),再在真实用户的反馈与压力下不断“补功能、补体验”,同时祈祷用户不要流失得太快。在这一逻辑里,反复迭代不仅是常态,甚至被视为正确路径。创始团队默认接受一种现状:第一批用户中必然会有人离开。于是,大家便把希望寄托在后续版本上:要么通过持续改进把已经流失的用户拉回来,要么至少让那个不断漏水的“留存桶”漏得慢一点。

这种运作逻辑,几乎定义了SaaS行业多年来的常态:产品先以现有能力上线,随后眼看着相当一部分早期采用者逐渐流失,再通过高强度、快节奏的迭代,试图把留存率一点点拉升。高留存被视为真正的“黄金指标”,但众所周知,它几乎不可能在产品刚起步时就顺利实现,正如BK所说:“留存是应用的生命线,也是最难被真正改善的指标”。在SaaS世界里,产品早期出现用户流失几乎是一种“成人礼”:当然要尽量降低,但整体上,这是团队在一开始就默认、并提前纳入预期的现实情况。但现在,在AI世界中,一种反常、全新的变化正在发生。那套沿用多年的老玩法,正在被彻底翻转。

过去,早期留存偏低几乎是默认状态;而现在,我们开始看到,一些AI产品在第一批用户分群中,就实现了异常亮眼的留存表现。仿佛这些用户一开始就找到了自己真正需要的东西,用过之后便再也没有离开。这种现象并非发生在所有AI产品身上(远非如此),但一个全新的模式正在浮现,值得每一位创始人认真关注。我们开始将其称为“玻璃鞋效应”,而它正在从根本上颠覆我们对用户留存的既有认知。

一种新的AI现状:当“鞋子合脚”,用户就会留下来

为什么有些AI产品能够跳出「先做MVP、再承受高流失」的传统循环?答案可以归结为一个我们称之为灰姑娘“玻璃鞋效应”的假设。这个隐喻直接来自童话故事本身:不妨设想一群潜在的“客户”(在这个类比中,就是灰姑娘本人),不断尝试一个又一个解决方案、一款又一款模型,只为寻找那个真正合适的完美匹配。现实中,大多数产品要么能力不足、要么方向偏离,或者只是并不适合要完成的那项具体任务。而那些价值极高、却始终未被妥善解决的问题——我们可以称之为尚未解决的工作负载——就像灰姑娘的脚一样,一直在等待那只尺寸、形态与用途都恰到好处的玻璃鞋。

在当下节奏近乎失控的AI生态中,开发者正在以前所未有的速度试用各种模型。作为一个直观的佐证,OpenRouter的平台数据显示:短短一年内,其处理的token总量从10万亿级别跃升至100万亿以上,增长达到10倍;与此同时,新的模型接口几乎每天都在上线。每一次新模型发布,团队都会迅速抛出同一个问题进行验证:它是否真的能更好地解决我的问题?而在大量情况下,答案往往是否定的。于是用户很快流失,变成所谓的“AI游客”——短暂试用一次,随即转身离开,继续寻找下一个可能的选项。这反而才是常态:短时间的高度兴奋,有限的试验成本,然后迅速迁移到下一个新模型、新产品。热闹有余,沉淀不足,成为当前AI产品体验中的普遍景象。

但偶尔,某一代前沿模型的出现,会以近乎反直觉的精准度,真正解决一个长期棘手、价值极高的工作负载。那一刻,就像终于找到了灰姑娘的那只玻璃鞋。一小部分特定用户率先意识到,他们遇到了真正的“工作负载—模型匹配”:AI所提供的能力,与他们长期迫切需要解决的问题之间,实现了高度一致、几乎完美的对齐。这些用户的行为模式,随之发生了明显变化。他们不再像典型的早期尝鲜者那样快速流失,而是选择留下来、坚定投入:他们将模型深度嵌入自身的产品或工作流程中,围绕它投入大量工程资源,逐步形成事实上的锁定效应。毕竟,当一个模型终于能像手套一样贴合自己的使用场景时,又有什么理由轻易更换?

我们将这批一开始就高度黏性的用户称为“基础用户群”。他们往往在产品刚上线、模型首次被视为业界最先进时便迅速出现,被一种“真正全新能力即将到来”的承诺所吸引;而一旦这一承诺被兑现,他们展现出的留存表现往往异常出色。这种情况就像是:产品并非在上线后慢慢摸索并积累用户,而是在第一天就直接找到了最理想、最契合的那一批用户。这与传统MVP叙事几乎完全相反。在AI产品中,最早的一批用户,反而可能比后续进入的用户,展现出更强、更持久的长期留存能力。

为什么后续进入的用户往往不那么忠诚?原因在于:当那批已经穿上“玻璃鞋”的用户完成了真正的匹配之后,新进用户更多只是出于尝试心态在探索,或者他们的核心需求早已被其他解决方案覆盖。此时,这个模型已不再代表最新的前沿突破,而只是众多可选工具中的一个。一旦使用过程中仍有需求无法被满足,这些后来者往往会迅速转向当下最流行的下一款模型。相比之下,基础用户群则依然稳固地留下来——因为他们已经找到了与自身场景高度契合、几乎不可替代的那一次匹配。

基础用户群的实际表现:两次模型发布的对照案例

要看到“玻璃鞋效应”在现实中的具体体现,可以回顾近期几次AI模型的发布。我们分析了来自《State of AI:一项覆盖100万亿Token的实证研究(State of AI:An Empirical 100 Trillion Token Study)》的用户使用分群数据。该研究基于OpenRouter平台的数据,对真实世界中LLM的实际使用情况进行了全面、系统的观察与分析(通过OpenRouter数据,对真实世界LLM使用行为的全景式研究)。

从留存曲线中,可以看到一个非常清晰、也颇具冲击力的故事。每一个用户分群,代表的是在某一个特定月份开始使用某一模型的用户;曲线随后展示的是,这批用户在接下来的各个月份中,仍然保持活跃的比例(只要用户在任意一个后续月份再次使用该模型,即便中间存在使用间隔,也会被计为“留存”)。

以Google的Gemini 2.5 Pro为例——这是一款在2025年中期发布、一经亮相便被视为顶级“前沿”模型的旗舰产品。从数据上看,2025年6月的首发用户分群表现尤为醒目:即便在发布5个月之后,这一批用户中仍有接近35%持续活跃地使用该模型。对于一组围绕单一模型展开使用的开发者用户而言,这是一个异常亮眼的留存水平。这背后传递出的信号十分明确:在6月份,有相当一批开发者在Gemini 2.5 Pro上找到了他们真正需要的能力——可能是更强的编程表现、更显著的准确性提升,或两者兼而有之。正因如此,他们选择持续投入,而不是像往常那样很快迁移到下一个新模型。

再将其与几个月后才完成入驻的用户分群进行对比——例如2025年9月或10月开始使用的用户分群——差异就变得十分明显。这些后续分群的用户流失率显著更高:它们的留存曲线迅速下探,几乎贴近底部,这意味着这批用户在随后的几个月里几乎全部消失。

为什么会这样?到2025年秋季,Gemini 2.5 Pro已不再是那个最耀眼的“新事物”——更新一代的模型已在酝酿之中,而那些尚未找到理想匹配的开发者,仍在不断对比、尝试不同方案。与此同时,6月份的基础用户群早已占据了该模型最核心、最具代表性的使用场景。结果是,后续进入的用户更多成了“探索者”:他们尝试了Gemini 2.5 Pro,却没有发现与自身需求高度契合、堪称“灰姑娘级别”的匹配,于是选择继续前行,转向下一个模型。

在Anthropic的Claude 4 Sonnet身上,也能观察到几乎相同的模式——这是在同一时期推出的另一款前沿模型。其2025年5月的首发用户分群在第4个月时仍保留了约40%的用户,这一表现与Gemini的早期用户分群大致相当,但在Claude自身的各期用户分群中,依然显得尤为突出。这批5月入场的用户,显然踩中了一个关键契合点(也许是Claude 4在高级推理能力上的表现,或是其超长的上下文窗口,解决了当时其他模型难以应对的问题)。而在Claude 4 Sonnet的留存图表中,后续分群则呈现出截然不同的走向:秋季才开始使用的用户流失速度明显更快,很可能是因为到那时,Claude 4已不再具备独特性,尚未被满足的需求促使他们转向了其他选择。

从本质上来说,当一款AI模型以清晰可辨的技术领先优势推出时,它会拥有一个短暂的机会窗口,用来吸引并留住一批基础用户群。这个窗口期往往非常有限,可能只持续到下一次重要模型发布之前。在这一窗口内,最早“试用”该模型的用户,要么找到了契合点,要么没有。如果找到了匹配,他们就会演变为重度用户,在市场热度消退之后,依然持续使用产品(并保持较高的使用强度),支撑产品的长期活跃度。而如果没有找到匹配,结果同样直观:此后出现的每一批用户,表现都会趋于一致——短暂、易变、迅速流失。

当“玻璃鞋”不合脚时:警示性的案例

如果那个关键的“玻璃鞋”时刻始终没有到来,会发生什么?遗憾的是,我们同样有这样的例子:一些模型在发布时,从未真正展现出独特且具备黏性的优势。它们的留存图表看起来更像是一条纯粹的商品化曲线:每一个用户分群的行为几乎完全一致(而且表现得并不理想)。以Gemini 2.0 Flash(Google较早一代的模型)或Llama 4 Maverick为例。这些模型在发布时确实展现出尚可的能力水平,但并未相对于既有模型形成一次清晰的前沿跃迁。结果是,没有任何一个用户分群真正建立起长期、稳定的黏性关系。用户来了,简单试用了一番,然后流失——无论他们是在第1个月还是第10个月开始使用,流失速度和模式都几乎没有差别。

在留存图表中,各个用户分群的曲线在图表底部彼此重叠、纠缠在一起,呈现出一种令人沮丧的景象——没有任何突出表现,也看不到所谓的基础用户群。直白地说,产品从未真正找到产品—市场匹配。它几乎是在发布的同时,就直接进入了我们可以称之为“够用即可”的市场:在这个环境中,有大量模型都能把事情“勉强做好”,却没有任何一个能够激发真正的忠诚度。由于未能被视为品类领导者,也未能被认知为解决了一类全新问题的关键工具,这些模型最终都没能锁定任何规模可观、具备长期价值的用户基础。

为什么“基础用户群”比以往任何时候都更重要

在基础模型快速演进的时代,围绕用户留存的博弈规则已经发生了变化。我们正进入一个阶段:AI能力不再是缓慢的小步前进,而是以跨越式的方式跃升。每一次能力跃迁,都会打开一批全新的使用场景——让某一个模型首次真正把过去始终无法解决的任务彻底跑通。而一旦你做到了这一点,正被这一问题困扰的用户就会自然聚集过来,并长期留下。

这种“灰姑娘式”的动态机制,对AI公司和投资人都产生了深远影响:

产品—市场匹配=工作负载—模型匹配:在AI产品中,所谓的产品—市场匹配,往往并不是“功能是否足够全面”,而是是否在某一个高价值工作负载上,形成了压倒性的解决能力。真正的竞争力来自于在一个关键能力维度上的深度突破,而非横向堆叠特性。一旦触及这一关键契合点,用户留存便会顺理成章地出现——因为用户终于在这里,解决了一个他们长期以来无法被真正解决的问题。

先发优势的重新定义:率先进入市场,并不必然意味着成功——除非“先发”本身等同于率先把一个迫切存在的问题真正解决好。“玻璃鞋效应”所揭示的是:第一个将能力水平提升到全新高度的模型,往往能够在对应的能力维度上,锁定绝大多数高度忠诚的用户群体。一旦这种匹配成立,后来者即便功能相近,也很难再撼动这一基础。

这类用户在后期变得极难被撬走,因为他们已经围绕该模型构建了完整的工作流、业务逻辑,甚至形成了稳定的认知与使用习惯。一旦切换到竞争对手的模型,往往需要付出重新训练的成本、结果质量的不确定性风险,以及额外的工程改造投入——这些都会形成极高的摩擦成本,使原有的绑定关系得以持续。从商业角度来看,这正是由高切换成本驱动的经典锁定效应。当一个AI模型被深度嵌入之后,再想将其替换掉,其难度不亚于硬把灰姑娘的鞋套到另一只脚上。

以留存作为北极星指标:在新一代AI工具竞相涌现的“淘金热”中,人们很容易认为增长本身就是一切(注册量、采用规模)。但真正理性的创始人,会同样重视留存曲线所传递的信息。是否已经出现了基础用户群?是否至少存在一个用户细分,已经离不开你的模型?如果你观察到的是所有用户分群的行为几乎完全一致,且都在短时间内快速下滑,这就是一个明确的警示信号——你可能需要在差异化能力上投入更多精力,或者将产品进一步聚焦到一个更具体、更尖锐的痛点上。反过来看,如果某一个用户分群的留存表现明显优于其他所有分群,那就值得被认真研究。他们正是你那批穿上“玻璃鞋”的用户;而深入理解你的产品为何恰好契合了他们的需求,将直接指引你的roadmap,以及你对投资人所讲述的核心叙事。

前沿窗口期极其短暂:数据表明,所谓的“前沿模型桂冠本身就是转瞬即逝的。每一代新模型,只会在极短的一段时间内被视为前沿,直到下一个有力竞争者出现为止。这意味着,AI公司只有一个非常有限的窗口期去捕获那些最难获得、也最具价值的基础用户群。这几乎是一次性机会,用来打动最难被打动的那批用户——那些长期存在未被满足需求的人。一旦错过这个窗口期,剩下的就只能是在渐进式改进的泥潭中缠斗。对于AI初创公司而言,这直接抬高了产品发布的风险与压力:某种程度上,这几乎是一次“成王败寇”的赌注。一旦成功命中,其回报极其可观(牢固的用户锁定,甚至在某个细分领域形成准垄断);而如果发布表现平平,代价同样高昂——高流失率,以及之后艰难而漫长的差异化之路。

结语:为“玻璃鞋时刻”进行产品构建

“灰姑娘玻璃鞋效应”并不只是一个形象的比喻,它真实反映了AI正在如何重写产品采用与用户留存的底层规则。在这样一个新模型层出不穷、开发者只需一次API调用就能完成切换的世界里,用户忠诚度似乎天然短暂而脆弱。然而正如我们所看到的那样,当一个AI产品真正击中了某个深层且高价值的需求时,它所创造的不是“过客型用户(tourists)”,而是“真正的拥护者(fans)”。这些早期的核心用户会在顺境与逆境中持续留下来,为企业提供长期稳定的根基,而正是依托这样的根基,完整而可持续的商业体系才能被真正建立起来。

对于AI领域的创业者与产品构建者而言,结论已经非常清晰:真正理解你所处市场中那些尚未被解决、却价值极高的问题。目标应当是——率先把其中一个问题彻底解决,哪怕覆盖范围非常聚焦;而不是在一个拥挤的赛道里,打造一个“勉强够用”的泛化产品。两者之间的差别,就像是货架上又多了一双鞋,与成为那只终于与脚型完美契合、被反复寻找的玻璃鞋之间的差别。

归根结底,AI下一阶段的叙事,也许并不取决于谁的模型更大、更快。真正决定走向的,可能是那些能够理直气壮地说出这样一句话的团队:“我们找到了真正需要我们的那批用户,而且在四个月之后,他们依然还在。”这,正是完美匹配所带来的魔力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version