每个系统都有一个比其他所有都更紧的瓶颈,就像一条链子只有一个最弱的环。不在约束点上的任何改善都是幻觉。 这个单一的原则,高德拉特的约束理论,否定了每一个存在过的组织的默认管理哲学:到处的局部改善会自动转化为全局改善的假设。

简单的画面

咖啡店有一台慢收银机。再好的客服、再高质量的食物、再快的WiFi、再干净的卫生间、再浓的咖啡都不会提高产出。唯一重要的是收银速度。改善别的东西不只是浪费,是积极有害的,因为它消耗了本该指向唯一能推动指针的那件事的注意力和资源。

在用尽已有产能之前就添加产能,就像沙发堵在快速车道上时给高速公路加车道。二战的教训是最戏剧性的应用:盟军赢不是靠赢更多战役而是靠轰炸生产约束,即使庞大的军队也无法在战场上足够快地摧毁装备,所以瓶颈永远是工厂。明斯基循环揭示了镜像失败:在约束点优化掉缓冲看起来像效率但实际上是脆弱,杠杆系统中的瓶颈是扰动中的存活,不是吞吐量。

局部最优的灾难

关于局部最优的传统洞察是它们次优,不如它们能达到的好。约束理论把这戏剧性地尖锐化了:在相互依赖的系统中,局部最优实际上让事情更糟。

机制如下。考虑一个有五个阶段的管道,工程是瓶颈。工程的产能很快填满,往那边送更多工作不产出额外的成品。但销售、产品和设计在现代职场的普遍规则下运行:“保持忙碌”。 没有什么比一个未充分利用的资源更让经理恐惧。没有什么比觉得没有足够的工作来证明自己存在更让员工恐惧。

于是上游团队开始新项目。这不可避免地向瓶颈发送更多工作。即使工程有纪律拒绝请求,光是偏转来的就消耗宝贵产能,更多邮件、更多估算、更多政治操作来抵挡压力。瓶颈的生产产能进一步缩减。

这触发一个死亡螺旋。随着瓶颈吞吐量下降,更多工作堆积,上游团队更无事可做,他们开更多项目,向瓶颈发送更多工作。下游团队面临反向的同样问题,等待工程,他们开始创造”请求工程输入”的副项目。会议、跨功能倡议、各种开销,每一种都进一步耗尽瓶颈。

管理层看到危机并用他们知道的唯一工具回应:“看起来更忙!” 这是被真诚执行的OSS破坏手册。所有人忙碌的公司是所有人在以瓶颈的生产力为代价优化自己生产力的公司,而只有瓶颈的生产力决定系统的吞吐量。

五个步骤

1. 辨识约束

把手指按在价值流的一个点上。如果你无法辨识瓶颈或不愿意让假说被测试,你永远不会聚焦努力。**“最稀缺资源”**这个术语在外交上有用,因为”瓶颈”伤感情。

约束经常被错误辨识。在真正瓶颈上游添加产能向它发送更多工作,减少吞吐量。在下游添加产能创造产生瞎忙的闲置产能。两者都让系统更糟。这是应用于系统的专家型初学者问题:以高能力改善错误的东西比什么都不做更糟。

高德拉特最反直觉的发现:即使在制造业,最限制性的约束几乎总是一个软约束,一个政策或规则,不是一台机器。一个看起来无害的在24小时内提供时间估算的政策消耗了一个微软团队40%的总产能。政策从一个被误解的词或一个不赞成的眼神中瞬间冒出。不像物理约束,它们不受反向压力,一台极度功能失调的机器在物理下崩溃,而一个极度功能失调的政策扭曲行为多年没人注意到。

2. 优化约束

约束每丢失一分钟就是整个公司丢失一分钟。看起来太贵的投资突然成为第一优先级:

  • 缓冲约束,上游团队必须有过剩产能来建立精心包装的就绪工作队列以便于消费
  • 在约束之前质检,永远不要把瓶颈时间浪费在需要返工的工作上
  • 从约束卸载,如果另一个人能执行约束哪怕1%的工作,即使效率低得多,投资以整个公司吞吐量的速率回报
  • 保护免受打断,最小化沟通线路,提供安静工作条件,把进度汇报等开销卸载给支持人员

3. 让非约束服从

所有非约束的工作是让自己的决定服从于约束的需要。它们为系统绩效优化,不为自己。这是最难的步骤因为它要求非约束团队刻意在低于产能下运行,接受可见的闲余,与职场训练进每个人身体里的本能直接矛盾。

4. 提升约束

只有在完成前面步骤之后添加更多约束产能才有意义。五步工程算法编码了同样的层级:质疑需求、尝试删除流程、简化、加速,然后才自动化。添加产能,像自动化一样,是最后手段而非第一手段。《系统圣经》原则适用:从简单开始,让它进化。不要从头设计复杂方案。

5. 重复

一旦约束被提升,新的瓶颈在别处涌现。过程永远不结束。

丰田的秘密

大野耐一的丰田生产系统不是一个最大化成品产出的流程。 它是一个最大化流程改进产出的流程,即使以短期盈利为代价。系统被设计为以浮出最有用教训的方式崩溃。

大野故意向西方参观者模糊了这一点:

我尽最大努力阻止参观者完全掌握我们的整体方法。我用谈论减少七种浪费(无駄)……和用日语名字的技术如看板来解释它。 — 大野耐一

福特装配线的天才不在速度而在它限制在制品库存的新颖方式,流动的大敌。通过用传送带连接工作站并严格限制站间空间,在制品无法堆积。大野通过看板卡达到同样效果,在站间指定最大库存。看板的力量在于告诉每个工人什么时候不要生产。

约束理论的顿悟回应了这一点:当几乎所有人工作更少,公司产出更多。这是探索-利用洞察的组织等价物,过早利用(保持忙碌)摧毁了系统进行真正重要的聚焦工作的能力。

常见误读

低水平理解:“我们需要更多资源,多招人。”

中等水平理解:“我们需要更好的流程,实施敏捷/Scrum/任何趋势方法论。”

更好的理解:约束决定吞吐量,其他一切都是噪音。 给一个迟到的项目加人让它更迟(布鲁克斯定律)。更好的流程应用于约束以外的所有地方产出文档更好的功能障碍。米洛标准把这应用于产品设计:瓶颈不是工程产能而是用户的认知吸收速率,人类形成新习惯的生物速度。比米洛速率更快地发布功能是在约束之前添加上游产能。唯一重要的问题是:瓶颈在哪里,什么阻止了它满产能运行? 不是这个问题答案的一切都是对错误问题的局部最优回应,而在相互依赖的系统中,错误的优化比不优化更糟。

核心收获

约束理论揭示了组织生活最深的病理:把忙碌等同于生产力。任何出现的过剩产能都被隐藏,被遮掩在扩展填满所有可用空间的瞎忙迷雾中。后来当真正增值的工作到来时,所有人都”忙”。看到自己的人没时间,管理层得出结论问题是”缺产能”然后招更多人,他们做更多瞎忙,为约束创造更多开销,进一步减少吞吐量。

修复需要接受一个每个组织本能都抗拒的真相:要让系统中哪怕一个部分满负荷运转,其他每个部分都必须有过剩产能。 闲余不是浪费。闲余是流动的前提条件。不能容忍可见闲置的公司永远达不到不可见的吞吐量。

参考: