14.学习的真相.模型匹配¶
人类呢,一出生就开始对人脸敏感。对刚出生的婴儿来说啊,它只有人和非人的区别。而一个正在活动的东西是不是人啊,要看它有没有一张人脸。也就是说啊,婴儿的大脑里呢,与生俱来的有一个关于人脸的模型。这应该是人类出于生存的需要,而最终将其刻在记忆内的基础功能。对人类来说,一切的识别都是针对模型的识别。
心理学上呢,有一个专门的词汇啊,叫Paredonia,被中文呢比较生硬地翻译成了叫“空想性错觉”。空想性错觉,它指这样一种心理现象,指的是大脑对外界的刺激,一幅画面或一段声音,赋予一个实际的意义。但那个实际的意义呢,只是巧合,对啊,那个所谓的实际的意义并不存在。这个意思大概就是什么呢?中文说叫“无中生有”。这种无中生有的错觉呢,在我们识别人脸的时候呢,是最为普遍的,也最能够从一个独特的角度向我们展示模型识别的过程。
上面这张图哈,从上往下,从左往右啊,分别是1、2、3、4四张图拼起来的哈。其中呢,图一呢,是1954年加拿大纸币上被人们认出来的魔鬼的面庞。图二呢,是2001年美国911恐怖事件袭击发生的时候,在双塔大厦的浓烟中被人们认出来的魔鬼面庞,对吧?图三呢,是1976年太空船维京一号传回来的火星照片,被人们认出来的一张人类面庞,对吧?然后呢,图四呢,是2022年,就是今年啊,尼康摄影竞赛中获奖的一张蚂蚁头颅的正面照,就是蚂蚁的头正面照啊。很多人表示极为不适,因为它看起来就是一张魔鬼面庞。
在大脑皮层当中啊,一切都是模型,一切的所谓识别都是模型识别。所谓的模型呢,就是对事物的抽象,即该事物的若干个主要特征的组合。当我们识别某个事物的时候呢,我们大脑啊,不是通过完整对照整个事物的每一个细节,而是通过提取事物的少量重要特征,然后呢,运行基于记忆的预测,最终判断感受到的东西究竟是什么。无论是看到的,还是听到的啊,闻到的或者是摸到的。
就是另外一个关键在于说哈,嗯,大脑基于记忆做出预测的时候,是除了使用这个抽象机制之外,还有另外一个重要特征,就是无需精确,不需要精确的等于啊,只需要大概约等于就开始预测了。他不需要准确的,他只需要等于或者约等于就开始预测了。为什么呢?因为随后还应该有一个验证或者排除的环节。你就说你预测了不一定准确嘛,然后呢还要验证,还要排除,对吧?
所以呢,当我们看到以上四张图当中的人脸或者魔鬼面庞的时候,其实准确的讲,并不是空想出来的。我们之所以能够看到那事实上并不存在的东西,首先是因为我们的记忆当中有人脸和魔鬼面庞的模型。其次是因为这两种模型对我们来说实在是太熟悉了,所以呢,曾经被调用的次数非常非常多。于是呢,我们的大脑啊,会利用最熟悉的模型去做预测。而我们所谓看到的,就是我们的大脑基于自己最熟悉的模型做出的预测。
所以你看啊,越是迷信的人,就越倾向于能更够快速地识别出魔鬼面庞。为什么呢?因为对他们来说,那个模型相对更熟悉。比如说上图当中哈,那个加拿大纸币里那个女人的头发的最下面的一端,看起来像一个魔鬼面庞这件事情,对啊,对绝大多数不迷信的人来讲啊,是不那么容易识别出来的。等人告他了,再去看看,哦,好像是耶。
请注意啊,就是越是迷信的人,越倾向于能够相对更快速地识别出魔鬼面庞。为什么呢?因为越是迷信的人,对魔鬼面庞的这个模型越是相对更为熟悉,对吧?你没那么迷信,那么你曾经调用这个魔鬼面庞的次数就相对比较的少,是这个道理吧?所以呢,像上面哈,嗯,1954年啊,加拿大版的那个,1954年版的加拿大纸币上啊,那个所谓的魔鬼面庞啊,对绝大多数并不迷信的人来说,应该是相对难以识别出来的。那些人家已经告诉你,然后你仔细看看说,哦,还真的耶。
有一句玩笑话说哈,嗯,手里拿着锤子的人,看什么都像钉子。实际上呢,也是这个Paredonia的一个经典案例了,就是无中生有的经典案例。为什么会这样呢?因为你手里拿着锤子的时候呢,钉子的模型就成了你的脑子里最相关甚至最重要的模型。于是呢,你无论看到什么,你都要首先把它与钉子的模型配对,而后做出预测。也正是这样的这个机理啊,造成了最普遍的现象,就是你的任何预测依据,都肯定来自于,也只能来自于你自己最熟悉的领域。我再重复一遍啊,就是你的任何预测依据,都肯定来自于,也只能来自于你自己最熟悉的领域。
就稍微总结一下哈,就是大脑的工作过程其实是这样子的:基于最熟悉、最常用的抽象模型,做出近似的、有待验证或者纠正的预测。再重复一遍啊,基于最熟悉、最常用的抽象模型,做出近似的、有待验证或纠正的预测。你深入理解这句话啊,能在极大程度上瞬间提高你的独立思考能力。
但是我想啊,其实呢,没有人愿意否认啊,独立思考能力的重要性。他无论是在学习上、工作中,还是在生活里,那独立思考都至关重要。尤其毫无疑问的是,独立思考能力基本上是决定一个人赚钱能力的基础能力嘛。首先呢,做出最好的决策,哪怕是最佳的理解,那需要大脑皮层里拥有足够多的模型可供选择。其次呢,最常用、最熟悉的模型不见得是最佳模型啊。然后呢,瞬间得到的结论,即最直接、最初做出的那个预测,它只不过是近似的、粗略的,并不是值得直接信赖的。最后呢,如果是验证成功倒也罢了,那请问验证失败的话怎么办?那其实就是仅仅完成了一次试错,对吧?而试错呢,是需要通过反复操作,才能通过不断排除错误选项,接近正确选项的。
然而呢,到这里并没有结束。还有一种常见的可能,就是最终发现当前所有的模型都是不适用的。那所有的模型都是不适用的,那就意味着说,基于当前记忆当中的模型进行预测,得不出正确结论。那怎么办?那就要想办法改进当前的模型,或者干脆建立新的模型。事实上呢,以上就是独立思考的全过程。
在日常生活当中,我们的大脑所识别处理的最多的,其实并不是实物,即所谓的具象事物。其实与我们的直觉相反的是,我们处理识别更多的,其实是抽象事物。并且呢,受教育越多、文化程度越高的人,他越是如此。那平日里啊,我们要是形容某个人没文化,其实本质上指的是什么?就这个人脑子里针对抽象事物构建的模型极为稀少,太少了,乃至于不够用,不够多,不够用。
其实呢,你想想就知道了,我们在义务教育阶段学的所有的一切啊,比如说什么语文啊、外语啊、数学、物理、化学、生物啊,以及在高等阶段啊学习的各种专业知识,哪怕是在技校里学的一切,请问哪个领域的核心它不是抽象概念呢?就毫不夸张地讲啊,只要是真正重要的,全都是实际上看不见、摸不着的抽象概念。
与此同时呢,其实事实又表明,最终我们脑子里所拥有的每一个模型,绝大多数都是后天学习的。尤其是那些关于抽象事物的模型,每一个都是百分之百后天习得的。重点在于,一切可以被我们称为文明的、智慧的、有生产力的模型,最终都是抽象的。也就是说,都是只能后天习得的。再换一个说法,就是人类不断文明化的过程,其实无非是不断习得并应用关于抽象事物的模型的过程。于是我们才有了宗教,我们有了法律,我们有了科学,有了技术,有了发展和创造。
我们可以说,人类与其他动物的主要区别在于人类有更深厚、更丰富的情绪或者感情。我们也可以说,人类与其他动物的关键区别在于我们会说话、有文字,等等等等。你可以说出很多很多关键或者重点,但是最大、最遥远的距离,就是人类与其他动物最大、最遥远的距离是什么呀?在这段话里呢,我把抽象概念和抽象模型的放在一块了。那也就说,人类与其他动物最大、最遥远的距离在于什么呢?就是基于种种原因,人类呢习得并积累了海量的抽象模型,并且呢用这些抽象模型构建了更多的抽象模型,进而最大程度改变了或者说改善了自己和自己依赖生存的世界。
再次与我们的直觉相反,我们针对具象事物所构建的模型,事实上呢更模糊。然后呢,我们针对抽象事物构建的模型,其实更准确。然后直觉相反在哪呢?就是我们针对具象事物构建的模型更复杂,反过来,我们对抽象事物构建的模型其实更简单。一般人们总是会误以为抽象的是很难的,这是与我们直觉相反的,抽象的更简单、更准确,具象的反倒是更模糊、更复杂。
我们要举例子了啊,这个例子稍微长一点。当我们看到一张桌子的时候呢,我们瞬间就会认定它是一张桌子。然后呢,你会觉得这个事太简单了,因为你觉得因为那桌子是具象的,所以呢我们是看得见、摸得着的。于是呢,整个过程太过简单,太过显而易见,这是你以为的。而整个过程当中也确实给你这种感觉,为什么呢?因为你的大脑只经过一次的预测,然后就得出了答案,甚至不需要去验证,所以你感觉它非常非常的简单。
虽然你可能并不清楚你脑子里对于桌子所构建的模型究竟是怎样的,但很显然哈,我们看到的那个物体,和我们脑子里针对桌子这个具象物体所构建的模型是对得上的。于是呢,我们不假思索的就知道那是一张桌子。可事实上并不是这样子的哈,因为桌子是一个具象事物,于是呢,我们中的绝大多数人啊,误以为太简单,乃至于从来没有认真哈描述过我们脑子里那个对于桌子的模型的呃定义。那桌子就是桌子,只是一张桌子,明显是张桌子,这就是我们对桌子的看法,对吧?
甚至哈,即便是我们认真的去翻阅词典啊,读过词典里对桌子的定义,定义啊,也会觉得那定义无聊透顶的。词典里是这么说的:桌子是一种日常家具,在平板的下面安有支柱,可在上面放东西、做事情。他就是这么说的。下面呢,我就给大家描述一下哈,我们的脑子里哈,桌子这个模型挺复杂的,或者说很复杂的。你看到一个东西,你怎么知道它是桌子?有好多方面要考虑的。
你看,第一个方面是这样的:它应该拥有一个足够大的、可以支撑其他物体的平面。这里的“足够大”就很模糊,那究竟多大才算是足够大呢?你不知道。然而呢,不管怎样,要是你看到一个物体只有一个很小的、甚至不够放下一本书的平面,那么那个物体就无法被你称为是桌子。你可能会把它称作架子,对吧?比如用来放花盆的支架,反正它和你脑子里被称作桌子的模型是对不上的。虽然你说不清楚你脑子里的关于桌子的那个模型究竟是怎样的,但是你知道它是对不上的。
我们再看第二个方面:除了刚才说哈那个平面呢要足够大,对吧?第二个方面是这样:那个平面呢应该足够高。但究竟是多高呢?还是没有明确定义的,但好像还是有界限的。你看,太高了肯定不行,比如说哈,离地面两米,那你就可能把它叫做亭子,不叫桌子,对吧?太矮了呢也不行,比如40厘米,长一点宽一点,你都可能把它叫做茶几,对吧?面积小一点的你会叫它凳子,狭长的你会叫它长凳,它反正不是桌子。要足够大,要足够高。
然后呢,我们再看第三个方面:第三方面是这样的,它的这个平面呢,应该是水平于地面,或者是说,起码要近似于水平于地面的。如果你看到那个平面明显是倾斜的,你还是不会把那个东西叫做桌子的,对吧?也许你会自动认为那不可能是一个桌子,它可能是一个残次品。也就是说哈,它和你脑子里被称作桌子的模型是对不上的。但是在我清楚地告诉你之前,你没有清楚地如此考虑过。
再看第四方面:那有些物体呢,也同样有一个足够大的、可以支撑其他物体的平面,但是你知道它不是桌子。比如说哈,它可能是一个柜子或者台子。再比如说哈,我们看下一个方面,就是它还应该有左腿。不论是什么形状的,反正它应该好像有个桌腿,对吧?你管它是方柱形的还是圆柱形的,亦或是其他任何形状,你所构建的模型其实并不在意一张桌子究竟有几条腿的。你见过很多种桌子,一条腿的你也见过,两条腿的你也见过,三条腿的、四条腿的你都见过,对吧?甚至呢,即便是有桌布的情况下,桌布很长,遮住了视线,乃至于你看不到究竟有几条腿、桌腿是什么形状,那物体还是在你脑子里构建的模型对得上的,对吧?就是你还是能够瞬间的、啊、识别出来那是桌子,对吧?
还有呢,你可能大意了啊,现在有很多电脑桌呢,是有一个以上的平面的,它分层。电脑桌这样的两个平面的电脑桌你见过吧,对吧?但是呢,在我们的大脑里的模型,依然可以毫不费力的与这个桌子的一个平面对的上的,对吧?就是你还是能够瞬间的、啊、识别出来那是桌子,对吧?还有呢,你可能大意了啊,现在有很多电脑桌呢,是有一个以上的平面的,它分层,你依然可以毫不费力的与这个桌子对上,给我们识别成功的感受。
那我仅仅是描述了啊六个方面,那还有呢。但是呢,仅仅这六个方面的每一个方面里啊,都有大量的我们不这么细说的话就没有想过的,但我们知道一样,对吧?这个例子很长哈,但你现在明白了,就是通过这个例子我们明白了,就是通过这个例子我们明白了什么呢?我们的大脑里那些关于具象事物的模型,其实是异常复杂的,并且呢处处都是含混的。于是你也能理解了,为什么人工智能的科学家们想要搞出一个能够在图片当中把猫识别出来、识别出来的模型和算法,竟然那么不容易,对吧?这你能明白,就是具象物体的模型其实是非常复杂的,虽然它含混,虽然我们总用,但是它非常复杂。
但是反过来哈,当我们构建、处理关于抽象事物的模型的时候,其实是既简单又准确的。并且呢,如果那不够简单、不够准确,竟然有歧义的话,那么这个抽象模型或者这个抽象概念其实是无用的,应该是被删除掉的。因为只有毫无歧义的抽象概念,才能够被用来继续构建、继续组合,持续构建、持续走组合。
我再举个例子啊,比如说,什么是圆呢?圆,那学几何的时候你当然学过,对吧?圆的这个模型定义是非常准确的,他说:从中心点到周边任何一点的距离完全相等的图形。你看,这就是用我们说的人工语言去描述的,每一个字都是没有歧义的。当然了,在你今天看起来如此简单的一个抽象模型,事实上是有很多抽象模型构成的,比如说点、中心、中心点、任何一点、周边、相等、完全相等、图形,每一个词其实都是抽象概念。但呢,它准确,没有任何歧义。很显然啊,这又是一个学习的概念。很显然啊,这又是一个学习其实很简单的证据。
可能最关键的启发在于说,你要明白,大脑从一开始就是抽象机。人类的大脑从一开始就是抽象机,抽象机器!换句话讲啊,它从一开始就是更擅长处理抽象的机器。反正对它来讲,一切都是抽象的。所以你别再被误导了,别再听些某些人说什么女生天生不擅长数学,因为她们的抽象能力欠缺。这绝对是胡说八道,因为这等于在说这些女生不是人。这种东西啊,这抽象能力是不可能分性别的,除非用的不是人脑。
另外呢,我们深入了解大脑的工作过程,它总是基于我们最熟悉、最常用的抽象模型,做出近似的、有待验证或者纠正的决策。就这么一个事实,了解这样的工作过程,事实上给我们了一个最充足的理由去真心崇尚科学。因为科学本质上就是对整个世界的无歧义的、简单且准确的抽象。我再重复一遍啊,科学本质上就是对整个世界毫无歧义的、既简单又准确的抽象。所以我们要崇尚科学啊。
基于这些简单、准确且毫无歧义的抽象模型做出来的预测,首先呢更准确。其次呢,更为重要的是,随后的验证成本和试错成本更低,有时候甚至几近于零。所以我们要崇尚科学啊。好,我们下节课再见,我们下节课再见,谢谢大家。