关于 “奖惩机制” 的进一步思考¶

人类的学习机制呢，就是基于正负反馈的试错机制。那只要试错呢，就会得到反馈，可能是正反馈，也可能是负反馈。正反馈呢，会向尝试者证明该尝试可能是可行的，而多次的正反馈会让尝试者笃信该尝试的可行性，进而将该尝试呢、该策略呢升级为更优选择或者最优选择。而与此同时呢，负反馈的作用呢，就是恰恰相反的。不过呢，在这里需要注意的是，所谓的正反馈，指的是某个尝试成功了，无论那个尝试是对的还是错的、是好的还是坏的。那也就是说，正反馈本身并不保证，也不决定那个尝试本身的对错或者好坏，它只是被证明为成功了一次而已。

那举个例子来说，偷东西呢，它也是一种尝试。那我们都知道，偷肯定是错的嘛，但是这个动作或者这个尝试有可能成功，不仅成功偷到了，还成功地掩盖了没有被发现。那这就是偷这个错误尝试的正反馈。小朋友呢，时时刻刻都在试错，他们的每一个尝试都可能会得到正反馈，也可能会得到负反馈。基于这些正负反馈呢，他们在不断调整、优化自己的策略，你别管它是有意还是无意。所以说呢，这个“人之初，性本善”这种说法，多少它其实是一厢情愿。在最初的时候呢，小朋友其实并不知道是非、对错、好坏、轻重，这些判断呢，都是需要学习的，它无法通过遗传获得，它都是需要在大脑皮层不断建设的过程当中同时发展。

与此同时呢，父母是另外一方。父母与孩子最大的不同，它不仅仅是相对身强力壮，更为重要的是，相对于孩子来说，父母呢拥有，或者是理论上应该拥有更加完善的大脑皮层、更多的知识、更多的经验、更好的判断。那这里的关键呢，是父母的判断力。父母呢，理论上应该更懂得是非、对错、好坏、美丑、轻重之间的重要，以及各种微妙的区别。而所谓的家庭教育呢，核心就在于说，父母能否在孩子的大脑皮层发展过程当中，起到足够好的辅助建设作用。这个过程呢真的很久，因为人类差不多要到25岁，才能做到说大脑皮层发展完整。当然了，越是早期，父母在这方面的作用就越大、越重要、越关键。

那请问，当判断力尚在发展期的孩子不断试错的时候，作为对他们来说是外界的组成部分之一的父母，要不要做出反馈呢？这个答案呢，好像是显而易见。总是视而不见的父母，和不存在的父母有什么区别呢？那关键又在于说，父母应该基于什么做出反馈呢？当父母看到孩子做各种尝试的时候，父母呢应该有所判断，事实上也必须有所判断。我猜呢，正常的父母都能想明白了，要基于自己的价值观做出判断。当然了我们作为父母，希望自己的价值观是完整的、系统的、最好是正确的、至少是积极向上的。

现在呢，孩子做出了一个尝试，如果父母有判断的话，当然了不仅是理论上应该有，实际上也必须有。那么，如果父母有判断的话，大抵上无非可以归结为以下三类吗？第一类是无所谓，第二类是正确的，第三类是错误的。请注意啊，这是父母的判断，即父母的大脑皮层正常运转之后得出的结论。小孩子当然目前可能暂时不懂，也无法做到马上就能懂，更谈不上马上彻头彻尾的理解。又请注意，在这里啊，每个人都不一样，每个人的判断能力不同，所以呢判断也就随之不同。于是呢，大家很难达成一致。但是呢，判断质量高低的差异却永远事实上存在。这就是为什么我们会慨叹啊，这世界哪有什么熊孩子啊，只有熊爸妈而已。值得再重复一遍啊，这世界没有什么熊孩子，只有熊爸妈。

现在让我们回头接着说这三种情况里，第一种，那无所谓，那就无所谓了，很好办，甚至不需要怎么办。那正确的呢，好像应该奖励，这也好像完全没有什么争议。现在呢，最难办的部分来了，那错误的呢？于是呢，一旦发现孩子的尝试，在父母的判断来看是错误的，即所谓是非当中的非、对错当中的错、好坏当中的坏、美丑之中的丑等等等等，那么父母的唯一正确选择，是向那个错误尝试给出负反馈。事实上呢，这是父母的义务和责任，难道不是吗？否则的话，小朋友就不知道自己错了，他们只不过是在根据反馈去选择这次之后下一次的尝试方式，然后所谓的继续犯错，其实呢只不过是他们正在不断进步的体现，因为他们根据反馈优化了自己的策略。

父母们呢，经常慨叹，好事讲一百遍不一定学得会，可与此同时呢，坏事一点就透。那为什么会出现这种情况呢？因为一切非明确的负反馈，都属于正反馈。我再重复一遍哈，一切非明确的负反馈，其实呢都属于正反馈。因为没看到等于允许，视而不见等于允许，甚至只要没有明确的不允许，就等于允许。不然，在外界的反馈之中，它们的99%都是非明确的负反馈。对于正反馈来说，天生就更加渴求，每天都一样的，但凡有一线可能也不愿放弃的。那反过来，面对确定的负反馈，直接放弃是最划算的嘛。

我告诉你啊，这不是什么人性，其实呢天下一切生物都是如此，无论是人类还是猩猩，无论是哺乳动物还是节肢动物，哪怕单细胞动物的试错本能也是由此的，没有例外，也不可能有什么例外。这就是为什么无论在哪个领域，惩罚永远比奖励更有效的原因，且有效很多很多倍的核心原因。那只要还有希望，就得尝试，就想再次尝试，然后呢还要反复尝试，至于有没有奖励根本不重要的，可能的正反馈本身就是最大的奖励。反过来，惩罚尤其是严厉的惩罚，即明确的负反馈，那所有生物都一样，不说人了，所有人、所有生物都一样，避之不及。

另外呢，从社会交互的机制来看呢，奖励虽然对尝试者来说是收益，但对整个外部来讲是支出或者成本。所以呢，外部总是吝于给出奖励的，因为他需要成本嘛。惩罚呢，其实也有成本，但那是不得已也得支出的成本，所以呢硬着头皮也要支付。举个例子哈，大家都知道，我们所生活的世界里呢有很多法律，它就是用来规定什么是对的、什么是错的。对的呢，没有奖励，错的呢，必须惩罚。这不仅是法律的本质，他同时也折射着这个世界的真实状况。这个社会支付不起奖励成本，但整个社会还是要付出成本，因为他就算被迫，不得已也要耗费巨资建立执法队伍、供养执法队伍，甚至还要破土动工建设牢狱呢。

现在呢，请你想象一下，如果我们把惩罚机制去掉，会出现什么情况？多花一点时间想象一下。你别说去掉惩罚机制了，就算在当下惩罚机制如此明确的真实世界里，再加上评论里那么苦口婆心的劝说，也无法阻止总是有人这样那样的违规。比如说交通法，那总是有人闯红灯，怎么说都不管用；总是有人超速，怎么说都不管用；总是有人超载，怎么说都不管用；总是有人酒驾，怎么说都不管用。大家都知道的交通事故有多严重，难道你不知道吗？这就是真实的世界在教育我们，奖励可以没有，惩罚呢是不可或缺的。我再重复一遍啊，奖励可有可无，惩罚不可或缺。我告诉你，这句话重复多少遍都不过分的，因为这就是真实的世界。

你还记得吗？刚才我们提到说，正确的应该奖励，这好像也完全没有什么争议。真的吗？你再想想。我们把刚才我们所说的这个真实世界的真实做法，认真且又冷静的翻译一下，是这样的：就是这个真实的世界教育我们的方式，就是这么简单、直接、粗暴且有效。他怎么做的呢？首先，你做对了，他不理你；其次，你做错了，他惩罚你。这就是真实的世界。真实世界不是不爱你，我告诉你，他不仅不爱你，真实世界他事实上不爱任何人。当然你可以爱他，但那是你自己的选择，与他无关。他只有在你做错的时候，才会毫不犹豫的、不折不扣的给你负反馈。至于正反馈，可能有，也可能没有，反正他也无所谓。道理上也确实如此，因为只要不是明确的负反馈，你就会接着尝试嘛。

所以我们再来看看，这个“正确的就应该奖励”吗？答案是未必的。事实上，更真实的做法应该是，做对了也没有什么奖励，因为做对就是应该的。这就是真相，我告诉你，这就是真相，确实很少有人认真思考的真相，也是很少有人能够轻松接受的真相。话说回来，针对自己的子女，父母这个与真实世界最大不同的地方在于说，父母真的很爱自己的子女。于是呢，自然而然就产生了区别。首先呢，孩子做对了的时候呢，他就要奖励，必须奖励。说实话呢，也有支付奖励成本的意愿或者能力。与此同时呢，这也是有一种正面的解释，说这是爱的表达方式。而另外一方面呢，孩子做错了，那父母舍不得惩罚。你仔细想想看，这难道也是所谓的爱的另外一种表达方式吗？

那现在需要提醒的是什么呢？这些满怀爱意的父母们，忘了一个事实。什么事实呢？就是他们自己其实也是真实世界的一部分，只不过他们自己只是真实世界当中微不足道的一小个组成部分。如果考虑到整个真实世界的力量的话，你自己那一点点的爱，无论你自己觉得多么热烈，事实上真的微不足道，聊胜于无，也许就相当于汪洋之中的一滴水里的一个水分子的分量。因此，从此呢，父母们忘了这个事实相对来说并不可怕。那真正可怕的是什么呢？真正可怕的是，他们忽略了另外一个方向。在另外一个方向去看的话，他们呢，只不过是相当于汪洋大海之中的一滴水里的一个水分子的分量的所谓的爱，对子女的影响却是相当于海量。因为对孩子来说，越是早期，父母越是构成整个外部，或者说整个真实世界的越大的组成部分。

于是呢，我现在要问另外一个问题，这对孩子做出的错误尝试不给出负反馈，这到底是坏事呢，还是坏事呢，还是坏事呢？我告诉你，这只能是坏事嘛。因为这就是父母失职。无论基于什么样的理由，无论你有没有爱，这不重要，失职就是失职。至于用什么样的方法给出负反馈，那就不是我们在这里要讨论的话题了。你自己做父母的，你自己想办法，反正我用我的办法，你用你的办法，你也别问我，我也懒得说。各家有各家的办法，它没必要整齐划一，事实上也不可能整齐划一。另外呢，我也懒得矫情，这一点也希望你能够理解。

现在比较可悲的是什么呢？他不只是民间，连学术界都被带坏。在学术领域里，如果有哪个学者主张应该在必要的时候惩罚孩子，那么就会遭到所谓的群起而攻之。那每年下来啊，只有那么几篇主张在必要的时候应该适当惩罚孩子的论文被大量引用。不过呢，在几乎百分之百的情况下，被引用的理由不是用来支撑作者自己的观点，而是用来批判。于是呢，现在不能惩罚孩子，哪怕在学术界里都成了所谓的政治正确。奖励与惩罚，他们呢就好像一辆推车的两个轮子，本来呢是一对相辅相成的组合。那现在呢，绝大多数人生硬的非要把惩罚彻底消灭掉，把那原本好好的机制变成一个残疾机制。那你说，那辆推车只剩下了一个装在侧边的轮子，能用了吗？

那我不相信只用奖励能做出一个独轮车的，因为奖励本来就是可有可无的，惩罚才是不可或缺的。然后呢，我们也同时没有办法完全不顾另外一个事实，那就是什么呢？相对来看，惩罚总是比奖励更有效的。你要是非要在这其中去掉一个的话，那我觉得应该去掉的是奖励。换言之，我才用惩罚去做一个独轮车，也许真的不见得不行。可是呢，现在几乎所有的家长，用的都是用奖励做的独轮车。一个很明显的结果就是，那些在成长过程当中大量缺失、极度缺失原本应该获得的负反馈的人，物批量的长成了所谓的玻璃心。他们脆弱且无知，当他们有一天走出那所谓的爱的小屋，因为成年了嘛，所以必须独立的为自己的错误买单的时候，他们在玻璃心碎一地的同时，的确不知道自己到底哪做错了。因为在他们以为的世界里，和在他们现在所面对的真实世界里，差距实在是太大。

你仔细想想看，的确不知道自己哪做错了，这是不是不仅可悲，而且可怕啊？你听一听吧，你看一看吧，“压力好大”这就是他们的口头禅。心灵脆弱是他们的一致写照，受不得任何打击，别说物理上的或是身体上的打击了，哪怕别人有不同的看法，他们都接受不了，甚至别人说了几句就崩溃了，动不动就抑郁了，动不动就自闭了，动不动就自杀了。到了那一天，那些曾经用自以为是的、所谓的满满的爱意，养育出这样的孩子的父母们，请问是不是值得同情呢？是不值得同情呢，还是不值得同情呢，还是不值得同情呢？在过往的三四十年时间里，这样的情况我们看到的少吗？真的不少，比比皆是，随处可见，都懒得举例。

所以呢，我们家里呢，是有明确的惩罚机制的。并且呢，我们作为家长，明确地、反复地讨论过，没有任何明确的奖励，尤其是明确的物质奖励，我们家是没有的。那可以夸，可以抱，可以一块开心，可以一块欢呼，但是明确的物质奖励就是不可以有。因为在我们家，每个人都知道，把事做对、把事做好，那就是应该的嘛。事情没做好，可以鼓励，告诉他们多试几次总会比原来更好。反正呢，作为父母，我们自己也是这么做的。但是呢，事情做错了，就要接受惩罚，无论什么理由，这就是这个真实的世界的运转的真实方式。

我问你啊，惩罚自家的孩子，怎么可能心里舒服呢？怎么可能因此会开心呢？那不可能的。那我们也爱自家的孩子啊，那世界都不爱我，我还爱这个世界呢，那请问我怎么可能不爱我自家的孩子呢？可是我们知道，什么事情都是有边界的，哪怕是我们呢，所谓热烈的爱也是有边界的，起码是可以用对错来分辨的。在必要的时候惩罚自家的孩子，正是出于正确的爱啊。那小时候他做错了，作为父母不惩罚他，那么长大之后，那这个世界会替你用数十倍、数百倍甚至上万倍的力度去惩罚他。你作为父母，想到未来，眼下你真的舍得吗？我不知道你是怎么想的啊，我是肯定做不到已经想到了未来，却依然无动于衷。那不仅我做不到，商量过后，我老婆觉得自己也做不到。所以呢，我们就达成了一致，那相互鼓励着、咬着牙，该惩罚的时候严格且又明确的惩罚，或者该给出负反馈的时候就要给出负反馈。比如说，孩子无理哭闹的时候，压根就不理他。

那同样都是爱，请问差别在哪里？一个呢，是基于当下感受的爱；一个呢，是基于未来结果的爱。请问呢，你没有看到区别就罢了，当你看到这个区别之后，当你意识到这个区别之后，这两种爱里，如果你只能选择其中一个的话，请问你会选择哪一个呢？你应该选择哪一个呢？李笑来在讲家庭教育方面的内容的时候呢，远比他讲投资内容更为费力。其实呢，这个投资行为是群体一致的，我不管你是谁，我不管你什么年龄、什么性别、什么职业，大家做的事情都是一样的，都是应该剔除情绪干扰的。尤其呢，我讲的是定投策略，那定投策略就更为简单了，它只有一个动作，不仅应该也只能大家整齐划一。

可是呢，家庭教育它不一样，它不可避免的充满了总是存在的、不同程度的情绪的干扰。那并且呢，人人的判断体系都不一样，千差万别。那我觉得是对的，你不一定觉得是对的；我认为是错的，你不一定认为是错的。是非、对错、好坏、美丑、轻重，大家各自都有一套属于自己的体系，哪怕压根就没有任何体系，其实也是一种极为普遍的情况。你看，由于人们千差万别，所以呢，你别说争论了，有的时候连正常的讨论都事实上不可能，甚至毫无意义。所以呢，最终李笑来的策略就是，只讲最基础的判断。

于是呢，我就要不停的深入、不停的思考、不停的探索，去找什么呢？去找最底层、最简单的东西。最底层、最简单，那换个措辞，其实呢就是找我们大家的最大公约数。我去寻找谁都不能否认的事实与真相，如果找到了，那么就认真讲解。然后在这个或者这些最底层的层面上获得的共识，基于这些共识，我们进一步思考。下一步呢？下一步，我们每个人都一样的，都要基于这些不可否认的事实，再叠加上自己已有的判断能力，进而能够走出的，就是一条只能属于自己的路。

那我们回顾一下，刚刚我们讨论的事实与真相，以及我们做出的简单判断。比如说，人类的学习机制，它就是基于正负反馈的试错机制。如果你不认同这一点，那我随后讲解的所有内容都没有意义。你认同，我们就可以继续讨论下去。第二件事情是什么呢？正负反馈并不保证尝试的对错或者好坏。然后呢，父母应该更有判断力，这也是事实，不可否认的事实。那孩子呢，不知对错，这是事实；父母呢，应该知道对错，这又是事实；指出孩子的对错，那是父母的责任，又是事实。

好了，然后呢，我们去思考，为什么好事千遍不会，坏事一点就透呢？紧接着，我们讲解为什么惩罚比奖励更有效呢？那里面的所有的思考都是事实，都是最底层的基础事实。然后我们就进一步理解了这个真实的世界是什么样子。什么样子来着？就很简单嘛，对了没有奖励，错了一定惩罚。然后呢，另外一个事实是什么呢？就是父母是真实世界的一部分，尽管他充满了爱，但是呢，越是早期，父母就构成真实世界的更大部分。于是呢，对孩子的错误尝试不给出负反馈，那就是父母的失职嘛。我管你出于什么理由嘛，请问这是不是事实？这是不是一个简单且不可否认的事实？

好了，我们再看，对孩子的正确尝试，不一定非要做出正反馈。为什么呢？因为这更真实，因为真实世界就是这样的。然后呢，我们开始讨论了一个可能有争议的角度，当然了，这一点呢留给你自己思考。请问，政治正确真的正确吗？然后呢，大家都按照政治正确的做法去做了，到最后呢，开始用所谓的奖励独轮车，那实际效果又是怎样的呢？大家看不到吗？然后呢，我跟大家分享了我的做法，我们家是没有明确的奖励机制的，但必须有明确且有严厉的惩罚机制的，因为这符合真实世界的现状。然后呢，我们认为啊，爱是有边界的，所以呢，我们可以区分两种爱：一种呢，是基于当下感受的爱；另外一种呢，是基于未来结果的爱。

到此为止呢，我的分享就基本结束了。然后跟大家说了，为什么我只讲最基础的内容呢？因为这是最大公约数。然后呢，你呢，认同这些基础事实，那你就可以做进一步的思考，接着呢，走出一条只能属于你自己的路。最后呢，我也跟大家说一下，就是我呢，被逼着找到了这个所谓的策略，就是找最简单、最底层的事实与真相，因为这是最大公约数。这个策略呢，其实反过来对李笑来自己也产生了巨大的好处，因为我就是这样被逼着找到了最简单的事实和真相，乃至于我自己教育自己家的孩子啊，就感觉难度降低了嘛。因为只要做到了尊重最基础的事实和真相，接下来呢，就会做的不会太差。这真是极为意外的收获，堪称意外的好运，又是一个所谓的serendipity。

不管怎样呢，到最后，每个孩子都是父母的判断力所塑造的。非洲呢，有这样一句谚语，大概意思是说，父母不教的孩子啊，就会被整个世界教。那首先呢，这个世界没有责任和义务爱你或你的孩子。更为可怕的是，整个世界的判断力，是被大多数人的判断力所左右的。而与此同时呢，你也知道，大多数人的判断力是有缺陷的，不仅有缺陷，更大概率是有很多缺陷、有很大缺陷。那你说，你自己的孩子，你自己不好好教，你竟然拱手相让，让整个世界教，这不可怕吗？反正呢，我可