当一个度量标准变成目标,它就不再是好的度量标准。 这是古德哈特定律,这个观察说:把决策和激励绑定到一个指标上,会改变指标本应被动观察的行为。指标与它本应代表的底层现实开始分叉,而分叉对任何靠数字管理的人都不可见。

简单的画面

学校用学生考试成绩衡量教师质量。老师不再教理解,开始教考试。成绩上去了。真正的学习下去了。指标说学校在进步而学校在变差。指标没错,它在量它量的东西。问题是它量的东西不再是它本应代表的东西。

物化陷阱

指标是复杂系统的简化表征。它们允许对过于复杂、无法仅靠直觉管理的系统做出决策。这是真正有用的,指标能改善直觉并在原本没有透明度的地方增加透明度。

陷阱在于物化:把指标当作真正的目标而非不完美的代理。一旦指标被物化,人们为指标而非底层目标优化。指标被创造为通向现实的窗口;物化把窗口变成了只反映人们想看到的东西的镜子。

这是最危险的可读性。每个指标让系统的某个方面可见。让它可见就让它可控。让它可控就让它成为目标。让它成为目标就改变人们的行为。人们的行为改变了指标衡量的东西。循环自我强化:你越依赖指标,人们越为它优化,它越不代表现实,你越需要依赖它因为你没有其他信息来源。

《系统圣经》命名了结构版本:系统中的人不做系统说他们在做的事。 古德哈特定律解释了原因,声称的目的(由指标衡量)和实际行为(由激励塑造)永远在分叉,而当指标获得权力时分叉加速。

为什么分叉不可见

三种力量隐藏了损害:

1. 指标在改善。 如果考试成绩上去了,你怎么论证学校在变差?指标说你在赢。反驳它需要要么一个不同的指标(面临同样的问题)要么对现实的直接观察(而指标本应替代这个)。

2. 因果结构丢失了。 指标把系统的复杂因果网压扁成一个数字。靠数字管理的人看不到哪些因果路径被激励扭曲了。约束理论揭示了一个特定版本:到处的局部改善可以让系统变差,但每个局部单元的指标看起来很好。

3. 指标持有者受益。 绩效被指标衡量的人有充分激励为它优化而没有激励报告它与现实的偏离。格维斯原则解释了社会动态:糊涂人真心相信指标反映现实,失败者知道不是但没有权力改变什么,社会病态者设计了指标来精确产出这个结果。

指标作为信任的替代品

指标存在是因为某人不信任另一个人的判断。医院衡量结果因为行政人员不信任医生。学校衡量考试成绩因为学区不信任老师。公司衡量KPI因为董事会不信任高管。

工作的迷雾是架构结果:大项目让个人贡献不可见,于是指标成为评价人的唯一方式,而指标立刻变成偏离实际价值的目标。这是驱动暴力透明的同一个动态:单向可读性让被观察者对观察者可见而没有互惠。反馈管道变窄:指标替代了本应浮出指标无法捕捉的细微差别的对话。随时间推移,指标就是关系,而关系是空洞的。

你越深度依赖一个指标,越是在承认你用测量替代了理解。 这有时是必要的,你无法理解你管理的每个系统。但这种承认应该产生谦逊而非信心。靠数字管理还睡得好的人,把地图当成了领土。

常见误读

低水平理解:“指标是坏的,信任人就行了。”

中等水平理解:“我们需要更好的指标,更精密的衡量能解决问题。”

更好的理解:问题不在指标的质量而在把它当目标的行为。 更好的指标面临同样的定律。精密指标变成目标的那一刻,人们会一样热切地为它优化,只是做得更聪明。指标设计至关重要且某些错位不可避免,但最重要的防线是永远不忘记指标是代理,不是事物本身。 工程算法适用:在优化一个指标之前,问这个指标是否应该存在。在改善衡量之前,问理解是否可以通过更便宜的渠道获得,比如跟做工作的人谈谈。

核心收获

古德哈特定律是花园中一半组织功能障碍底下的元原则。专家型初学者为验证他们高原的指标优化。破坏管用是因为它优化了被设计为尽职指标的程序。Scrum速度用工单吞吐量替代了工程判断。保持忙碌的律令把利用率当作生产力的指标而它实际上是浪费的指标。

每个指标都是一个关于什么重要的故事。古德哈特定律说故事改变了它描述的现实,而改变的方向永远是让故事看起来成立而底下的现实飘向故事看不到的地方。个人版本:坏决策来自长期未经检视的代理优化。 你多年前选了一个代理来代表你想要的东西,从未重新审视,现在代理在掌控你的生活而它本应代表的东西已经悄悄变了。如果你不解决问题的根源,你最终会为解决了的人工作。

参考: