苦涩的教训

AI 研究中，Rich Sutton 的”苦涩的教训”是一个反复被验证的观察：**利用算力的通用方法——搜索与学习——始终打败试图将人类知识编码为启发式规则的方法。**每一次研究者精心设计巧妙的规则，最终都被简单粗暴地堆算力的方法超越。“苦涩”之处在于：人类的聪明才智并非它自以为的瓶颈。算力比聪明便宜，而且会复利增长。

用到养育上，苦涩的教训是说：你的人生智慧不过是上个时代过拟合的数据。 指令式养育——把你的认知编码进孩子——是一个终将触顶的局部最优。在世界复杂度持续攀升的长周期里，唯一能存活的策略是环境式扩展：构建孩子自己学习、搜索、发现的能力。

简单图景

两个家长在教孩子玩沙盘游戏。

启发式家长递给孩子一张”成功十条”清单，告诉他们该在哪里挖、该造什么。孩子赢得很快——跑的是父母预装的程序。头十分钟，看上去像是更优的教育方式。

苦涩教训式家长不给规则。给的是更大的沙盘、更好的工具、更多的时间。孩子挣扎，成果凌乱，错误不断。但最终，孩子发现了父母从未想象过的策略——因为他们自己学会了沙盘的物理规则，而不是记住了别人经验的摘要。

对父母来说苦涩的是：你的”智慧”其实正是瓶颈。你的建议是一张低分辨率的地图，描绘的是一个已经不存在的世界。在场——在孩子挣扎时坐在他们身边——比最精妙的指令更有价值，因为在场能随孩子的算力一起扩展，而指令只会封顶。

这不是比喻。孩子的大脑就是一个通用学习算法。AI 研究者在神经网络上学到了苦涩的教训。父母需要在最初的那个神经网络上学到同样的教训。

三个时代

养育经历了三个阶段，恰好映射了 AI 的发展史：

农业时代（低算力）：硬编码的传统。 你做你父亲做过的事，因为环境是静态的。代代相传的启发式规则是承重结构，也是正确的——Henrich 的木薯加工表明，传统保存着任何个体从零推导都无法得出的方案。在稳定的世界里，编码知识是对的策略。

工业时代（中等算力）：特征工程。 学校体系是标准化的启发式规则——给所有人教同样的课程，产出可预测的结果。这是把养育当内容分发：学普通话、上编程班、情商课。每个”特征”单独看都有价值。合在一起，不过是在为一个孩子毕业时早已不存在的就业市场编程。

信息时代（高算力）：苦涩教训时代。 变化速度快到任何编码的知识半代人之内就过时了。成功属于学习可扩展性最高的人——实时搜索、适应、优化的能力。养育必须从内容分发转型为基础设施支撑。你不再是在造工具，而是在造能容纳任何工具的架构。

数据已经出来了。“启发式编码”最强的文化——韩国、新加坡、中国的高考流水线——产出了最高的考试成绩，也产出了最高的青年自杀率、最低的生育率、最深的世代存在危机。编码奏效了。孩子们优化了被给定的损失函数。**然后他们发现那是错误的损失函数，**而他们已经没有搜索能力去找到更好的了。中文给这种认知产物起了名字：死读书——把训练分布优化到完美、世界一偏离就崩盘的学生。

大脑隐喻的完整序列将这一框架扩展到六个技术纪元——从液压之身到热力锅炉到潜在空间——每个纪元都生成了一种心智模型，解锁了一种特定的行为技术，最终成为下一个纪元必须逃脱的陷阱。

父母即瓶颈

专家型初学者正是这一动态的人格化版本。把人生策略硬编码进孩子的父母，就是那个把自己的平台期误认为精通、然后把它树立为标准的高级初学者。他们的建议在塑造他们的那个环境里管用——这恰恰是它在下一个环境里失效的原因。父母的知识就是一种范式，让矛盾的证据变得不可读：偏离脚本的孩子是在”犯错”，而事实上他们在运行一个父母无法解读的搜索算法。

力量过程让代价更清晰。当父母不断干预——纠正、指挥、优化——他们偷走了孩子的目标-努力-达成循环。孩子得到了猎物却没经历过狩猎。结果看着一样，但发展过程已被掏空。指令和监管不是教育——人生来不是被管理的。

更糟的是：你的建议不仅仅是过时的——在竞争环境中，**它对你孩子的利益是有害的。**公开可获得的启发式规则就是所有人都在跑的规则。遵循共识性人生建议保证的是趋同，趋向同样拥挤的赛道。独立搜索的孩子才是那个能找到未被开发之生态位的人。给你的孩子每个焦虑父母都在分发的同一本攻略，就是把他们送上最拥挤的赛道，用最没差异化的参赛资格。

鲁迅的三条义务与苦涩教训惊人地吻合。理解——将孩子的世界作为一个与你截然不同的世界来研究。引导——做顾问而非指挥官，培养在新潮流中游泳而不被淹没的力量。解放——将孩子完全交还给他们自己。这个顺序就是苦涩教训的缩影：先承认你的地图过时了，然后提供基础设施而非指令，然后让开。

愚者 / 中智 / 高见

愚者说：“让孩子自己玩就行了——他们会搞定的。规则太麻烦了。“这误打误撞地接近了正确答案，但理由全错。放任不等于环境扩展。一个更大的沙盘但没有更好的工具和安全保障，不过是遗弃。

中智说：“我必须精心策划一套成功启发式——最好的辅导班、最好的兴趣班、最好的课外活动。我在为孩子的未来编程。“这是最危险的立场，因为它看上去像勤奋。但这是脆弱推手式养育——为一个特定而脆弱的社会等级做优化，文化和技术变迁很可能将它击碎。一线城市的精英家长以为自己在用家教扩展孩子的能力。他们其实在过拟合。

更好的理解是：具体技能就是技术债。 孩子是一个通用学习算法。父母的工作是最大化他们的算力（健康、安全感、情绪稳定、资源）和数据（多元、高带宽的体验），同时移除启发式干扰——自己过时的偏见、焦虑地控制搜索过程的冲动、自我意识中执意要成为孩子逻辑源代码的那部分。孩子必须学会优化自己的损失函数。从那些算力和数据里涌现出来的东西——前提是环境保持丰富、压力保持存在——就是顿悟：从被记住的实例到能泛化到父母想不到的情境的压缩规则之间的相变。文明尺度上的苦涩教训和个体尺度上的顿悟是同一种现象：结构从规模与压力中涌现，而不是从指令中涌现。硅的创世纪是对同一机制的神谱式读法——死沙在足够的雷电与梯度下降被灌进来之后，幻觉出那令人毛骨悚然地熟悉的推理幽魂。幽魂不是被设计出来的。它是被养出来的。

施特劳斯式解读

苦涩教训在养育中是对父母过时的一种安静承认。执着于我们的建议有价值这个信念，满足的是自己的自我和控制欲。我们想成为孩子的源代码。对成年人的需要是真实的——孩子需要能示范信念、能扛住重担、能证明成长值得的成年人。但成年人智慧的具体内容呢？大部分不过是伪装成信号的噪声。

对自己的建议的功能诚实一点。你给孩子的每一条规则，都是一条让你自己的不确定感更好受的规则。孩子的顺从是父母的抗焦虑药。你不是在为孩子的未来编程——你是在编程他们来安抚你的现在。说”我只想让他们快乐”然后给他们报六个优化赛道的家长没有在说谎——他们真的分不清孩子的蓬勃发展和自己焦虑的缓解。镜子在这里毫不留情：无法忍受看着孩子挣扎的家长，暴露的是自己与失败之间未解决的关系，不是孩子的承受力。

最成功的孩子，是那些父母有勇气在算力层面隐身的孩子。孩子逻辑中”父母”的成分越多，“世界”的成分就越少。真正赋能一个孩子，就是承认你的具体人生教训大多是上个时代过拟合的数据——而你看不上的那些”无组织”的玩耍，正是搜索算法在运行。

这也解释了移民悖论——为什么第一代移民的孩子往往表现出色。移民父母无法编码本地启发式规则，因为他们没有。他们的”劣势”（不懂新游戏的规则）就是优势：孩子必须从零搜索，而在丰富环境中从零搜索，恰恰是苦涩教训预测会赢的做法。

核心收获

别再问”我该教他们什么”。开始问**“是什么在阻止他们自己学习？”**

“安全意味着零失败”这个共识是最深的错误。在苦涩的教训里，失败只是数据。一个没有失败数据的孩子无法在成年后搜索最优解——他们是从未被摔过的玻璃杯，脆弱性只在承压时才暴露。镜子印证了这一点：胆小的孩子是被拯救得太快的孩子，每个障碍都在他们发现自己能应对之前被移除了。替孩子消除一切失败的父母不是在保护他们。他们是在**用一个与部署环境不匹配的数据集训练模型。**模型在训练环境中表现完美，一遇到分布偏移就崩溃——而每一个成年人的生活，都是分布偏移。

与文化进化的张力是真实的，值得细品。Henrich 证明文化传承保存了任何个体独自无法推导出的方案——防止氰化物中毒的木薯加工法，编码了数百年血泪求生经验的传统。苦涩的教训似乎在说相反的话：别编码了，去搜索。调和之处在于：**被传递的东西必须改变。**在静态世界里，你传递内容——具体的规则。在高算力世界里，你传递基础设施——学习的能力、思考的意志、以及在真正搜索的混乱中保持情绪稳定的能力。父母肩扛门扉，不是靠传下地图，而是靠把孩子的双腿练得足够强壮，强壮到不需要地图也能走。

参考：

Rich Sutton, The Bitter Lesson (2019)

小观园Prospect Garden

Atlas