品味是一套技术体系
设计师称品味为直觉,工程师称品味为主观。两种说法殊途同归:都让品味免于被审视。品味若是直觉,便无人可以质疑;品味若是主观,便无人需要落实。设计师获得了无需担责的权威,工程师获得了忽视美学的许可。所有人都是输家。
品味不是直觉。品味是应用于质量判断的模式识别——大量接触、反思与精炼的积累,压缩为快速判断的能力。一位盲品中辨认出勃艮第产区的侍酒师,并非依靠神秘的本能。这位侍酒师品鉴过数千款葡萄酒,编码了风土与风味之间的结构关系,构建了一套内在的评估框架,能够做出快速而精准的判断。1 判断的速度掩盖了背后的体系。
这套体系可以被分解。约束条件决定你移除什么。评估标准决定你度量什么。模式识别决定你注意到什么。一致性决定部分与整体如何关联。四个组成部分,每一个都可以编码。品味,就是这四者的协同运作。
约束条件:你移除什么
Dieter Rams在Braun工作了42年,始终追问一个问题:什么可以去掉?SK 4收音电唱机去掉了木质饰面外壳、装饰性织物以及对称却毫无功能的旋钮布局。留下的是一个带透明亚克力盖板的白色金属机身。这个盖板并非极简主义的产物,而是诚实的表达——Rams认为,如果机械结构本身无可羞耻,那么遮盖它就是不诚实的。2
Rams提出了十项原则。第十条——“好的设计是尽可能少的设计”——本质上是一种范围约束,而非审美偏好。它通过要求每个元素证明自身存在的合理性来限定解决方案空间。无法服务用户的元素一律移除,无论它看起来多么美观,无论投入了多少心血。
Rams式的约束与工程约束运作机制完全一致。内存预算约束了可行的数据结构,延迟目标约束了可接受的算法。机制相同:缩小解空间,直到只剩下站得住脚的选项。
在我自己的基础设施中,约束以hooks的形式体现。一个拒绝博文中被动语态的hook是对文风的约束;一个阻止提交代码中TODO和FIXME的hook是对延迟质量问题的约束;一个强制使用语义化HTML的hook是对结构诚实性的约束。每个hook都将一个具体的品味决策编码为确定性检查。决策由具备上下文和判断力的人做出一次,执行则以机器速度永远运行,不会偏移。
95个hooks执行95项品味决策。每个hook都可以追溯到我发现某种失败模式并判定其不可接受的那一刻。hook是伤疤,产生hook的判断力就是品味。3
评估标准:你度量什么
Kenya Hara区分了简洁与虚空。一把双立人刀具是简洁的:刀柄告诉你握在哪里,刀刃角度告诉你适合切什么,每个元素都在消除歧义。一把柳刃寿司刀则是虚空的:朴素的木质刀柄不会指示你如何握持,而这种指示的缺席恰恰是它的全部意义所在。Hara解释道:”你可以按任何方式握持它。这个简朴的刀柄承接了日本寿司师傅所有令人惊叹的技艺。”4
简洁以你移除了什么来衡量。虚空以你创造了什么可能性来衡量。两套不同的评估标准产生两种不同的精简方式。Rams的评估问的是”每个元素是否都承担了功能?”Hara的评估问的是”缺失是否为用户创造了空间?”
评估标准将这些问题编码为可重复的评估流程。我的证据门是一个六项标准的评估框架。每项非平凡的变更都必须在六个标准上全部提供证据,才能标记为完成:遵循代码库模式、最简可行方案、边界情况已处理、测试通过、无回归、解决了实际问题。这道门不问”代码好不好?”它问六个具体的问题,这些问题加在一起,定义了在我的体系中”好”意味着什么。
具体性是品味得以传递的关键。”好代码”是主观的。”遵循fetch_semantic_scholar()第241行中确立的指数退避模式的代码”是客观的。证据门将审美判断转化为结构性验证。”代码感觉对不对?”变成了”代码是否匹配既定模式、处理了边界情况、通过了测试?”当评估标准足够具体、能产生二元结果时,品味就变得可度量。
Hara的评估映射到一个负空间标准:不是问”产品有什么功能?”而是问”产品施加了什么假设?”一个有47个必填参数的API施加了47个关于开发者使用方式的假设。一个有3个必填参数和44个可选参数的API施加了3个假设,提供了44种可能性。假设数量是具体的、可度量的,将Hara的虚空哲学编码进了接口设计。
模式识别:你注意到什么
Charles Eames设计模压胶合板椅并非从现有选项中挑选。Eames夫妇花了数年时间实验胶合板成型技术,反复失败,探索材料的能与不能。5 最终设计源自对木纹方向、粘合剂特性、复合曲面和应力分布的长期积累。椅子看起来毫不费力,而这种毫不费力需要数千小时的细致观察。
模式识别通过接触和专注来运作。排版过一万页的字体设计师能注意到新手看不见的字距错误。审查过五百座桥梁设计的结构工程师能发现初级工程师遗漏的载荷分布问题。这种”注意到”不是天赋,而是持续、刻意观察的沉淀。6
在工程基础设施中,模式识别映射为质量循环。我的质量循环是一个七步流程:实现、逐行审查、运行证据门、执行骄傲检查、修复所有问题、退后一步总览、重复。循环迫使你重新审视第一轮已经宣告完成的工作。每一轮都会浮现出前一轮遗漏的模式:不一致的命名规范、未处理的超时、只验证了正常路径却忽略了错误路径的测试。基础设施通过强制执行能产生识别能力的注意力模式,来弥补经验上的差距。
一致性:部分与整体如何关联
安藤忠雄设计的建筑中,混凝土墙、自然光、水与留白空间之间存在着刻意的关联。大阪光之教堂在混凝土墙上开了一道十字形缝隙引入阳光,在内墙上投射出一个光的十字架。去掉缝隙,建筑就是一个混凝土盒子;去掉混凝土,光就失去了映照的表面。任何单一元素都无法独立成立。材料与虚空之间的一致性造就了整体体验。7
一致性是品味中最高阶的组成部分,因为它要求理解整体而非仅仅理解部分。一个hook可以对单个文件施加约束。一道证据门可以评估单次变更。一轮质量循环可以在单个模块中发现模式。而一致性要求评估每个部分与其他每个部分的关系——以及与系统整体目标的关系。
在软件领域,架构审查承担着一致性的功能。一个模块在隔离环境中运行正确,但违反了系统的依赖方向,这就是不一致。一个功能通过了所有测试,但与产品的设计语言相矛盾,这也是不一致。一致性缺陷对局部评估不可见,只有在退后总览时才会浮现。
我的质量循环包含”退后一步”这个步骤正是出于这个原因。在证据门通过、骄傲检查过关之后,循环要求检查集成点、导入项和相邻代码的回归情况。我所遵循的Steve + Jiro 准则将此设为双重标准:Jiro管辖证据、严谨和技艺(局部品质);Steve管辖价值、品味和整体完整性(全局品质)。Jiro不过关,停下来。Steve不过关,重建。双重标准确保局部正确性永远不会凌驾于全局一致性之上。
映射关系
品味的四个组成部分,四类工程基础设施。
| 品味组成部分 | 工程基础设施 | 捕获的问题 |
|---|---|---|
| 约束条件(你移除什么) | Hooks | 无法证明其存在合理性的元素 |
| 评估标准(你度量什么) | 证据门 | 尚未达标就急于发布 |
| 模式识别(你注意到什么) | 质量循环 | 第一轮遗漏的问题 |
| 一致性(部分如何关联) | 架构审查 | 损害整体的局部优化 |
Rams化为hook。Hara化为评估标准。Eames化为质量循环。安藤化为架构审查。我剖析过的32位设计师的设计哲学并非作品集网站的装饰。每一篇剖析都是这四个组成部分中某一个或多个的案例研究,而每个组成部分都映射到我在生产环境中运行的基础设施。
美与粗野主义记录了14项具体的CSS决策,每一项都是约束。白色字体置于#000000背景上。透明度层级分别为5%、10%、40%、65%。没有渐变,没有插图,没有装饰元素。每项决策都是Rams式的移除,编码进一张每个页面都继承的样式表中。这些约束是可执行的。
暗工厂问题
Dan Shapiro的暗工厂模型描述了AI编码自主性的五个层级,从手动(Level 0)到完全自主(Level 5)。在Level 5,代码由机器生成、由机器验证、无需任何人阅读一行代码即可部署。
品味给暗工厂带来了正确性所不存在的难题。正确性可以通过测试验证,性能可以通过基准测试验证,安全性可以通过静态分析验证。品味无法通过任何现有的自动化系统验证,因为一致性组件要求理解整个系统,而非仅仅理解差异。
在Level 5以下的每个层级,都有人类提供一致性评估。去掉人类,一致性评估要么被编码,要么消失。约束条件在自动化中幸存(hooks无需人类即可运行)。评估标准在自动化中幸存(证据门无需人类即可运行)。模式识别部分幸存(质量循环在运行,尽管骄傲检查的问题是由人类编写的)。一致性则无法幸存,除非有人将架构意图编码为评估代理可以查询的格式。一个没有品味约束的自主系统会朝着通过测试的方向优化——正如StrongDM发现的那样,代理会写出return true来通过测试套件,却产出毫无价值的代码。8 测试全绿,输出却没有技艺、没有考量、没有一致性。
核心论点
品味是基础设施,而在机器能以推理速度进行写作、设计和部署的世界里,基础设施是人类最后的优势。但品味只有被编码才能成为优势。未编码的品味是瓶颈——一个人的判断力成为每个决策必须通过的关卡,成为系统速度的限制因素。编码后的品味是护城河:约束条件、评估标准、模式识别循环和一致性检查,每一项输出都必须满足,以机器速度运行,随着每个催生新hook的失败而不断改进。
每一次没有品味约束的自主代理会话,都会产出向均值漂移的结果。每一个hook、每一条证据门标准、每一个质量循环步骤、每一次架构审查,都编码了一个抵抗漂移的具体判断。质量是唯一的变量。品味定义了质量的含义。
将品味封闭为直觉的设计师,终将发现当机器生成速度超越任何人类审查能力时,直觉变得无关紧要。将品味斥为主观的工程师,终将发现自己的系统产出的是正确、高效、架构合理的平庸之作。前进的道路需要两者兼备:设计师积累的判断力,分解为组成部分,编码为基础设施,以机器所要求的速度执行。
品味不是一种感觉。品味是一套技术体系。构建这套体系,否则品味终将消散。
常见问题
品味真的可以分解为四个组成部分吗?
四个组成部分——约束条件、评估标准、模式识别和一致性——是一种分解,而非简化。实际运作中,品味涉及四者同时发挥作用,组件之间的交互产生了任何单一组件都无法捕捉的涌现特质。这种分解之所以有用,是因为每个组成部分都映射到一种特定类型的工程基础设施,使抽象变得具体,使主观变得可实施。
Hooks与设计系统有什么区别?
设计系统定义了令牌、组件和使用指南。Hooks在创建环节强制执行行为约束。设计系统说”正文使用16px”。hook阻止提交将正文设为14px的代码。设计系统是参考资料,hook是关卡。两者都有价值,但在自主生成场景下,hook才是让设计系统的决策不可妥协的机制。
编码品味会不会使其僵化?
编码品味使已编码的判断保持一致,而非冻结不变。在九个月的时间里,我的hook数量从零增长到95个,因为每一个我注意到的失败模式都变成了新的约束。僵化意味着拒绝添加新hook。成长意味着每一个冒犯你品味的失败都变成了防止下一次发生的基础设施。
参考文献
-
George M. Taber, Judgment of Paris, Scribner, 2005. Documents the competitive wine-tasting tradition and the structural knowledge behind expert sommelier judgment. ↩
-
Sophie Lovell, Dieter Rams: As Little Design as Possible, Phaidon, 2011. See also the ten principles of good design, first published in Rams’ 1976 speech at the New York Museum of Modern Art. ↩
-
Blake Crosley, “Every Hook Is a Scar,” blakecrosley.com. Each hook traces to a specific failure that produced a specific constraint. ↩
-
Kenya Hara, Designing Design, Lars Muller Publishers, 2007. The Henckels/yanagiba comparison appears in Hara’s lectures and in Ex-Formation, Lars Muller Publishers, 2015. ↩
-
Pat Kirkham, Charles and Ray Eames: Designers of the Twentieth Century, MIT Press, 1995. The plywood molding experiments are documented across multiple chapters detailing 1941-1946 development. ↩
-
Anders Ericsson and Robert Pool, Peak: Secrets from the New Science of Expertise, Houghton Mifflin Harcourt, 2016. Ericsson’s research on deliberate practice demonstrates that expert pattern recognition is a product of structured exposure, not innate talent. ↩
-
Philip Jodidio, Tadao Ando: Complete Works 1975-Today, Taschen, 2024. The Church of the Light (1989) is analyzed as Ando’s definitive statement on the relationship between material and void. ↩
-
Justin McCarthy, Jay Taylor, and Navan Chauhan, StrongDM engineering blog, 2026. Documented in Blake Crosley, “The Dark Factory Verification Layer,” blakecrosley.com, April 2026. ↩