← 所有文章

最小值得产品

在重建ResumeGeni的公共界面时,我反复撞上同一条令人不安的分界线。技术上能跑通的版本,未必是我愿意摆在求职者面前的版本。解析器能运行。输出能加载。流程能走完。然而体验中某些东西却在消耗信任而非积累信任。我坐下来琢磨一小时,重做那块界面,感觉消失了,但时钟不会倒退。

这种张力正是本文的主题。两股力量互相拉扯:一是尽早发布、让产品进入世界,二是拒绝发布那种消耗用户信任的产品。大多数构建者通过选边站队来化解张力。MVP文化选速度。完美主义选打磨。两种答案都失败了,因为张力本身才是关键。

最小值得产品是另一种标准——发布能赢得信任的最小产品,而不是能被你辩护为”能用”的最小产品。 值得是地板,不是天花板。最小是范围约束,不是质量折扣。MWP构建者削减功能直到产品能发布,并将剩余的每一处界面都守在用户能感知到的标准上。MVP构建者常常做相反的事:削减质量来保全范围。这种替换正是用户在数据中能感受到的。

摘要

MVP本应是一种学习工具:用真实用户测试真实假设的最小产物。退化后的版本却成了发布劣质作品的许可证。最小值得产品恢复了缺失的约束。先低成本验证,再构建能赢得信任的最小产品。最小削减范围。值得将剩余界面守在用户能感知到的标准上。


MVP做对了什么

最初的MVP理念并未授权发布劣质作品。它给创始人提供了一条路,停止花几个月去构建错误的东西。1

Eric Ries写《The Lean Startup》是为了应对一种特定的失败模式:工程师为根本不存在的市场构建精致的产品。MVP是学习工具。你构建能以真实用户测试特定假设的最小产物,运行实验,测量结果,并更新对假设能否在现实中存活的理解。MVP中的”最小”意味着为学习而收缩范围,而非为发布而收缩质量。

原始构想至今成立。我仍在使用它。我的创业验证序列(问题、方案、渠道、收入、规模)承袭自Ries。在投入代码之前对低成本可验证假设进行测试的论据,与验证之后采用MWP的论据同出一源:每个阶段的工具都应当契合该阶段。着陆页和访谈是用来验证”期望”的MVP。原型和技术冲刺是用来验证”可行性”的MVP。MWP则是在验证证据已到手、开始构建真实用户首次会信任的东西时,你所应用的标准。

所以我并不是在反对MVP。我反对的是MVP在实践中变成了什么。

MVP文化是如何变软的

不知何时起,”快速学习”变成了”随便发布什么”,这种替换造成了真实的伤害。

有三种翻译破坏了原始理念:

  1. “如果你对产品的第一个版本不感到尴尬,那你发布得太晚了”(Reid Hoffman的名言4)成了对手艺尴尬的许可,而不是对范围尴尬的许可。原始主张是关于功能数量:发布的功能如此之少,以至于未来的你会对产品所做之事的稀少感到尴尬。退化版本是关于做工:发布得如此粗糙,以至于未来的你会对产品的外观与手感感到尴尬。这不是同一句话。

  2. “快速发布”取代了“快速学习”,成为可衡量的结果。学习是一个缓慢、恼人且产出定性洞见的过程。发布是一个快速、可见且产出带日期产物的过程。当你无法区分两者时,产物便默认获胜。团队每周发布却完全停止学习,因为没人衡量团队学到了什么。

  3. 风投模式(融资、增长、退出)奖励”发布了什么”胜过”发布得对”。如果你的工作是向下一笔支票证明势头,一款注水的产品至少能跨过”我们发布了”的门槛。延迟的值得产品从外部看与停滞的团队无异。激励梯度指向下方。

这些退化都不是最初写就的MVP的过错。它们是MVP在那些需要为劣质发布寻找辩护的人口中变成的模样。

用户能感受到结果。你能从数据里感受到。新手引导完成了,但第二次会话再也没发生。用户打开注册邮件却从不点击链接。支持工单聚集在产品声称能处理的任务上。流失曲线衰减至零,而非拉平成核心用户。这些不是边缘案例。它们是建立在用户无法信任的标准之上的核心代价。

最小不等于未完成

最小是范围约束,不是质量折扣。

操作上:定义用户。定义产品承诺交付的那一个结果。移除一切不为该结果所必需的功能。然后将剩余界面守在完整的质量门槛上。最小削减范围直到产品能发布。最小不为让产品更快发布而削减标准。

举个例子。ResumeGeni的承诺是一份通过ATS的简历,让求职者有真实机会越过申请人追踪系统。该承诺的最小版本可以排除:

  • 自定义模板
  • 团队协作
  • 分析仪表盘
  • 与LinkedIn、Indeed或招聘网站的集成
  • 版本历史
  • 单一之外的导出格式

最小版本不能排除的是:对原始简历的准确解析、对差距的诚实评估、真正契合职位描述的具体改写、能在Word中干净打开的导出文件,以及让求职者感到安心的流程。你可以不带模板就发布。你不能带着模糊建议、失败的导出,或让脆弱用户感觉产品把自己当傻瓜的文案就发布。

最小是一把用在产品待办上的刀。值得是一把用在剩余界面上的刀。

值得是地板

值得的产品未必包含你所设想的一切。它所包含的一切都必须尊重用户。

操作意义上的值得,是指产品将验证过的问题解决得足够好,使用户带着信任进入下一次交互。他们看到你正在构建什么,并相信后续还有更多。第一次会话不再是一场煎熬,而成为一次打开通往第二次大门的握手。值得的产品积累信任。半值得的产品消耗信任。

你无法伪造信任。用户带着被他们已熟知的产品所塑造的期待而来。5 当你的产品低于这些期待时(按钮无响应、文案含糊其辞、流程中途弃他们而去),用户在明言之前就已经记录下这道差距。他们离开,不再回来,任何挽回邮件都无法挽救那次他们已经放弃的会话。

它值得吗?不是一个品味问题。它是一个信任问题。用户的回答以行为的形式呈现。

先验证,再值得

反对MWP最强的论据是:值得与否由用户通过接触决定,而非创作者的信念。正确。MWP并不取代用户判断。MWP是防止你在第一批真实用户有机会评判之前就烧光已验证的信任。

用户接触属于验证阶段。在构建之前,你要测试问题是否真实、你所提出的方案是否能解决它、你是否能触达用户、他们是否愿意付费。证据来自着陆页、访谈、管家测试、原型和等候名单。我已详细写过这个序列。经受考验的假设赢得了被构建的权利。

MWP在验证之后才开始。验证问的是是否有人想要这个承诺。MWP问的是已发布的界面是否配得上验证所赢得的信任。留存、推荐以及质量摩擦数据决定了这一判断是否站得住脚。

跳过验证而把结果称为MWP,只会为无人问过的问题给出漂亮答案。跳过MWP而把结果称为精益,只会产出一款注水产品,消耗验证已赢得的信任。

正确顺序:以真实用户低成本验证,然后为已验证的承诺构建最小值得产品。两者都要做。一个都不能跳。

两项测试:Jiro与Steve

一款产品在我称其为”完成”之前必须通过两项不同的测试。

Jiro测试问的是作品是否正确。证明产品能运作的证据。边缘情况已处理。看不见的细节已完成。主张都引用具体证据。不含糊其辞;我相信不是证据。Jiro测试把手艺与空想区分开来。我在Jiro质量哲学中写过这套纪律对AI智能体的应用;同样的纪律适用于每一处产品界面。证据门槛是我在代码报告中落实该测试的方式。

Steve测试问的是作品是否配得上存在。观点可见。整体一致。用户尊严得到维护。读者能够指认、而非含糊带过的某种惊艳或清晰机制。Steve测试把产品与库存区分开来。已发布的东西未必就是值得的东西。品味作为技术系统的完整论证在另一篇文章里;本文中以上的操作定义承担了这一重量。

两项测试都必须通过。若Jiro失败,停下并修复。若Steve失败,重建。若两者都失败,问题出在上游的任务简报里。

当判断不确定时,这套堆栈里最简单的追问是:我能否毫不犹豫地在上面签下自己的名字? 若答案是否,作品尚不值得。

脚下的证据:blakecrosley.com

你正在读的这个页面始于我在无路之路中的一次小实验。它也是论据的一部分。

没有React。没有Tailwind。没有webpack、Vite、打包器,也没有构建步骤。整个站点运行在FastAPI、HTMX、Alpine.js、Jinja2和纯CSS上,直接提供服务。当前构建下,首屏落在45到60KB之间,Lighthouse在性能、可访问性、最佳实践和SEO上均报告100分满分。3 该站点运行在九种语言中,新指南和博客内容以一次git push端到端发布,并且整个仓库中没有任何node_modules/

站点的MVP版本会遵循2026年的默认建议——Next.js、Tailwind、Vercel。它会在一个周末内发布。它会没问题。你会落在这里,页面会以一个体面的时间加载完毕。差别不会在能力上。差别会在品味上。我写过如何实际构建出Lighthouse满分;简短版本是:读者不必下载的每KB载荷都是一种尊重。

MWP版本耗时更长。MWP版本要求从零开始编写HTMX模式、手工调整排版、自托管字体、通过Cloudflare D1运行i18n流水线,并将缺少构建工具这件事视作一种特性。MWP版本在技术上并不比默认技术栈更强。MWP版本更有意图。这种意图体现为读者察觉不到的更少缝隙。

看不见的手艺。读者看不到决策。读者感受到摩擦的缺席。摩擦的缺席就是机制。

面向客户的证据:ResumeGeni

ResumeGeni拔高了门槛,因为用户不是在浏览。用户是在改进一份可能决定他们能否获得面试的文档。

ResumeGeni的验证结果干净:着陆页、等候名单、在Reddit和LinkedIn上的定向帖,两周内340个邮件注册,以及十几条询问产品何时开放的回复。7 验证序列说该构建了。构建是容易的决定。构建会是什么样,才是难的决定,也是MWP真正发挥作用的地方。

两类削减。第一类是功能:模板、协作、分析、数十种导出变体、招聘网站集成。全部砍掉。它们都不属于承诺的一部分。

第二类是我对剩余部分愿意守住的标准。标准不会被削减。解析器不能弱。建议不能含糊。导出不能出错。文案不能把脆弱用户当作转化指标。流程不能因为我只有时间做快乐路径,就在中途把某人丢下。

MVP版本会发布一个十步向导、通用的输出、在最好的时机设一堵订阅墙、以及一个承诺所有被砍功能的路线图页面。它会能用。它可能会转化一部分用户一次。它也会教会第一批用户不要信任该产品,而这个教训会成为脆弱使用场景的糟糕地基。

MWP版本比我想要的更小。我砍掉的每一个功能,我都会想要它回来。标准是:用户落到的产品尊重他们。这是我所知道的唯一能承载未来的地基。

用户实际告诉你什么

用户很少说我现在相信这个产品。但他们的行为会留下痕迹。6

我关注的五个信号,针对构建者受众校准:

  1. 二次成功率。 被激活的用户中,在自然使用窗口内返回并第二次完成核心结果的比例。信任在第二次成功时建立,而不是第一次。对于高频使用的产品,我把二次成功率低于30%视为重建信号。对于周期性产品,应衡量下一个自然使用周期,而不是强行套用30天窗口。

  2. 第30天留存相对于第1天激活的比例。 再激活邮件能粉饰原始留存数据。比例则粉饰不了。对于每周或每月使用的产品,这一比例告诉你激活是信任还是一次性好奇。我用低于0.25视为警告,低于0.15视为定论。

  3. 群组留存曲线形状。 值得的产品在早期下降后拉平。劣质产品持续衰减。画出曲线;形状讲述的故事会被均值掩盖。若曲线从未拉平,就没有真正信任产品的核心用户。

  4. 非激励自然推荐占比。 通过直接推荐、分享产出或口碑到来的新激活用户比例,不含付费渠道、也不含推荐项目的贿赂。值得的产品被谈论。劣质产品被遗忘。若品类存在自然的分享时刻,而自然推荐仍低于新用户获取的10%,产品就尚未赢得被推荐的资格。

  5. 质量摩擦率。 退款、愤怒点击、支持工单、失败导出、每100个激活用户的手动更正次数,按群组跟踪。该率是产品加诸于它声称要服务的用户身上的痛楚。随着产品成熟,该率应趋向下降。若该率持平或上升,问题出在产品,而不是支持流程。

这些信号都不是虚荣指标。每一个都很难作假。每一个都对应真实的用户体验,要么赢得了信任,要么没能赢得。如果你说不出某个具体群组在所有五项上的数字,那么你尚不知道自己的产品是否值得。

什么时候MVP或原型仍是正确之举

MWP并非适用于每一种产物的标准。

有三种情况,MVP或原型逻辑仍然正确:

  • 验证之前。 着陆页、访谈、管家测试、可点击原型。目标是学习,不是手艺。发布测试假设的丑陋版本。今天就发布。这里的正确剧本是验证序列,不是MWP。

  • 可行性冲刺。 当未知是技术性的(模型能否在我需要的延迟下回答此类查询?API能否承受负载?解析器能否在真实输入的长尾上工作?),构建能回答该问题的、最小的一次性工具。不要试图让它值得。让它真实。

  • 网络效应Beta界面。 市场、社区类产品和网络效应工具需要真实用户基数才能被评判,因此正确的产物是带有群组埋点、明确标示的Beta版。发布Beta不能替代值得版本;发布Beta是发现”值得”意味着什么的唯一方式。诚实地将界面标注为Beta。不要把它打扮成v1。

MWP针对的是第一处真实的产品界面。如果你仍在该界面之上游(学习、测试、发现),正确的工具位于序列的更后方。

重建上限

没有停止规则的高标准会变成逃避。

我在每一件非琐碎工作上应用的信条有一个三次诚实尝试的重建上限。2 一次诚实尝试意味着你识别了失败的维度、命名了具体的纠正动作、实质性地改变了方法,并将作品对照两项测试重新评估。把同一次打磨重复三遍不算三次尝试。那只算一次失败尝试被重复了三遍。

经过三次诚实重建仍无法产出值得产品之后,问题就不再是手艺。问题位于上游,在立意、范围、简报或团队中。停止重建界面,回头审视前提。有时候承诺对于你实际上能守住标准的范围而言过大。有时候验证比你以为的更薄弱。有时候问题根本不是产品问题。

重建上限解决两种相反的失败。它拒绝为劣质作品背书,也阻止精修沦为躲藏。目标不是完美。目标是值得且已发布。不是纯净而永久悬而未决

完美主义是没有勇气的手艺。若你在对同一处界面进行第四次重建,你已停止制作产品,而开始把这个项目当作躲藏之地。

关键要点

致创始人与独立构建者: - 在写任何代码之前低成本验证。MWP应用于验证确认市场契合之后。 - 积极削减功能。将剩余界面守在完整的质量门槛上。 - 在值得时发布。重建上限为三次。之后升级简报。

致产品负责人与PM: - 直接衡量信任代理:二次成功率、第30天对第1天留存比、群组曲线形状、自然推荐占比、每100用户的质量摩擦率。 - 把范围讨论与质量讨论分开。范围削减可以谈判。质量削减不可以。 - 保护你的第一批群组体验。在脆弱用户身上留下退化的第一印象,需要数年才能挽回。

致工程负责人: - 为每个发布的界面指定一个Jiro门和一个Steve门。两者都必须通过。 - 为看不见的手艺留预算。”能用”与”值得”之间的差别通常活在无人指向的细节里。 - 在流程中内建重建上限,让完美主义无法再伪装成精修。

致设计师: - 观点不是装饰;它是让产品可辨识的机制。 - 值得的界面会明显地拒绝一些东西。若团队什么都没拒绝,范围就错了。 - 模糊中的关键测试:你能否毫不犹豫地在这个决定上签下自己的名字?

结语:在它赢得信任时发布

产品中的支配问题不是它完成了吗? 支配问题是它配得上存在吗?

若答案是是,发布。若答案是”还不是,但经过三次诚实重建会是”,继续做。若答案是否,并在三次尝试后仍是否,重建简报,而不是界面。

这套方法是我对每一款署上自己名字的产品所采用的方式。MVP心态为周期进行优化。MWP心态复利出一套作品。

发布你能尊重的最小产品。不要比那更早发布。不要比那更晚等待。最小和值得是同一道指令,同时守住。


FAQ

什么是最小值得产品?

最小值得产品是已验证产品的最小公开版本,它赢得用户信任而非消耗信任。最小意味着范围被削减至核心承诺。值得意味着剩余界面达到用户能感知到的质量门槛。真实用户看到的第一件真实事物必须配得上他们的信任,而不只是能运作。

MWP与MVP有何不同?

最初的Minimum Viable Product是学习工具:测试特定假设的最小产物。在实践中,MVP退化成了发布劣质作品的许可。最小值得产品恢复了缺失的约束。验证覆盖是否有人想要这件东西(这是MVP、着陆页与访谈的工作)。MWP覆盖的是你在构建”验证已确认之物”的第一个真实版本时所守住的标准。

团队何时应使用MVP而非MWP?

有三种情况最小可行产品或原型逻辑仍适用:验证之前(着陆页、访谈、管家测试、可点击原型)、可行性冲刺期间(测试延迟或质量的一次性代码),以及网络效应产品,它们需要带真实用户的已标注Beta,团队才能定义什么是值得。MWP适用于第一个真实的产品界面,而不适用于它之上游的每一种产物。

如何衡量一款产品是否值得?

通过五个行为性信任代理,而非虚荣指标:二次成功率(激活用户中第二次完成核心结果的比例)、第30天对第1天激活的留存比(比例,而非绝对值)、群组留存曲线形状(平稳对衰减)、非激励自然推荐占比,以及质量摩擦率(每100个激活用户的退款、失败导出、支持工单)。值得的产品在五项上都表现出力度;劣质产品会在至少一项、通常全部项上暴露。


值得之门

一个将该框架应用于你自己工作的决策工具。走过五项输入,再走过三项信条轨道。没有分数,没有游戏化仪表。一个判决,点明维度与下一步动作。


参考文献


  1. Ries, Eric. The Lean Startup: How Today’s Entrepreneurs Use Continuous Innovation to Create Radically Successful Businesses. Crown Business, 2011. MVP作为学习工具这一框架的主要来源。原始概念退化为”发布劣质作品”是文化层面的,而非文本层面的;这本书本身对”最小”的含义保持着审慎。 

  2. 重建上限与双测试裁决(Jiro测试+Steve测试)出自我在每个项目上运行的产品信条。Jiro那一侧体现在为什么我的AI智能体有质量哲学中。品味即判断那一侧体现在品味是一个技术系统中。一篇专属于Steve的文章(整体一致、拒绝发布妥协、支配性追问)即将发布。本文中上述操作性测试是承重性的主张。 

  3. Lighthouse分数可通过PageSpeed Insights验证;100/100的数字是本文发布日期的当前构建。45-60KB的首屏传输大小通过禁用缓存的Chrome DevTools Network面板本地测量;读者可在实时页面上打开开发者工具并重新加载以复现。 

  4. Hoffman, Reid. “If There Aren’t Any Typos In This Essay, We Launched Too Late!”, LinkedIn, 2017年3月29日。Hoffman写道他创造了这句话,并围绕速度、学习、错误假设以及不完整但可接受的首次体验来构建它。Hoffman与Yeh的《Blitzscaling》(2018)是有用的背景,但LinkedIn文章是这句话更干净的主要来源。 

  5. Nielsen, Jakob. “Jakob’s Law of Internet User Experience”, Nielsen Norman Group。Jakob定律:用户大部分时间都花在你的产品之外的产品上,因此他们期望你的产品表现得像他们已熟知的那些产品。Norman, Don. The Design of Everyday Things(Basic Books, 2013),第三章,讲述用户心智模型如何形成,以及设计师模型与用户模型之间的差距为何会驱动大多数产品失败。 

  6. 这五项信任代理反映了我自己在ResumeGeni、Ace Citizenship以及创业验证栈中涵盖的十几个项目上的衡量实践。我借鉴的方向性文献:Andrew Chen关于增长停滞与留存基线以及下一功能谬误的论述;Lenny Rachitsky与Casey Winters关于按品类算什么才是好留存的论述;Sean Ellis的40%”必不可少”PMF基准;以及Amplitude关于留存曲线形状——包括平稳、衰减与再激活模式——的论述。本文中的阈值是我针对自己产品的自行校准;公开文献支持每一主张的方向,而非具体的切割点。 

  7. 作者的ResumeGeni等候名单与回复记录,2026年4月。340个注册与”什么时候能用?”的回复计数也在创业验证栈一文中报告,源自同一原始数据。 

相关文章

Startup Validation Stack: What 12 Projects Taught Me

I validated 12 projects in 9 months. Some followed the framework. Some skipped steps. The difference in outcomes taught …

10 分钟阅读

The Pathless Path: Leaving a 12-Year VP Role to Build

I left VP of Product Design at ZipRecruiter after 12 years to build independently. No plan, no destination, just curiosi…

8 分钟阅读

Critical Yet Kind: Feedback Principles Encoded in 86 Hooks

Google's Project Aristotle found psychological safety predicts team performance. I encoded the same principles into auto…

8 分钟阅读