【背景】:X君是数学家,研究通用学习机,在纽约。C君是3D+大数据+智能领域科学家,研发空间智能重构和相关的软件,在北京。X君与C君在前两轮对话中针对空间智能重构、人与动物的空间智能感知等问题进行了有趣的探讨。这是第三轮对话,谈通用学习机的相关话题。
北京时间2018年4月1日22:00左右,X君与C君开始了本次跨洋对话。
【C君】:我这边准备好了。
【X君】:那好。我们今天交流的话题,是围绕我的研究内容——通用学习机做一些讨论。我最近写了一篇中文文章,你也看到了。基本上我们围绕这篇文章谈。你有什么想法、交流或者评论,都可以随时打断我来进行互动。
【C君】:好的。
【X君】:我有几个观点需要先讲一下,就是机器学习的三个层次。
第一个层次:虽然我们是研究机器学习,但是越来越清晰地认识到,机器学习的牵涉面真是很广。目前这个领域也已经产生了若干新的工具和有效的结果,比如说AlphaGo,这点使大家都很兴奋。
第二个层次:机器学习可能会使得软件工程来一个新的飞跃。我们在软件编程方面花费了大量的人力物力,而且越来越多非常复杂的问题,复杂到再也没有足够的人力物力来投入支撑了,所以必须找到一种新的自动化方法去写软件。机器学习实际上带来了一种新方法,可以为计算机提供新的发展方向。
第三个层次:可能很多人还没真正注意到,研究机器学习有可能会成为敲开智能大门的一个很重要的工具。人们对于智能有很多思考和猜测,但是真正从科学角度进行把握的却并不多。大家应该注意一点,就是智能的最本质是什么?我认为,那就是它应该具有超强的适应能力,可以适应各种环境。这一点上就揭示出了学习能力的实质——到了一个新的环境,可以学习新的东西。学习能力来说应该是通用的,也就是说它一定有一些基本规律在其中。如果通过研究机器学习或者所说的通用学习机,能够找到其中一些基本规律,就可能进入新的层次。
【C君】:嗯,我理解。
【X君】:这就要求我们跳出现有局限,去思考一些本质性的东西,所以这是我们研究通用学习机的目的。
那么什么是通用?就是说它可以用于学习写字、分辨声音、识别图像,甚至于学习解微分方程等等。通用学习并不局限于某个领域。至少在深度学习以前,所有的学习都是非常有局限的。深度学习出来之后,的确有一个飞跃,它也是一个数学模型,不过它的通用性初步体现出来了。但是到目前为止,还没有很多人真正静下心来去研究这里面的原理——为什么它可以通用?为什么它可以学习很多东西?
机缘巧合,我有幸能静下来思考这个问题:为什么可以通用?通用背后的道理在什么地方?通用能够产生的效益在哪里?这是我们为什么要做通用学习机的出发点。
【C君】:嗯,打断一下,我们来互动一下。我最近累计花了一天时间对这篇中文文章进行了系统学习,对里面主要的公式、定义、定理从前到后都进行了推演,感觉这套体系还是很严谨的,我也颇受启发。刚才所论述的“三个层次”,我也基本理解。不过我有一些总结,可能是对刚才观点的一些补充。
从学习的角度来讲,我有一个思考视角,就是把学习分为两大类:一类为功能结构驱动型学习,另一类为数据驱动型学习。比如:传统的工业机器人,它就是一个设备,被赋予了某种基本的运动功能结构逻辑,在自动化操控系统的操作下,它可以精准重复操作一系列的动作,这属于功能结构驱动型学习。而深度学习,比如说AlphaGo,它是典型的数据驱动型学习,它对外的功能很简单,就是在既有训练学习的基础上形成一系列的特征知识功能逻辑,针对下棋过程中的对手输入数据进行反应,表达出相应的知识反应。我觉得,学习应该从这两个维度来分析。
你所说的通用学习机,在某种程度上说就是以数据驱动为主的学习机。而我们人类的聪明在哪里?我们既有数据驱动的学习,通过大量的感知,形成强大的数据驱动型的学习能力;我们也有像机器人一样的功能结构驱动型的学习,比如手伸多长才能够得着碗、腿怎么蹲下去才能爬过去等等。人类的强大之处,在于能够把两者有机结合起来。这是我对学习的一个小思考。
【X君】:说的很好,数据驱动型的确并不是学习的全部。但是,目前来讲,为什么我们现阶段主要精力集中在数据驱动型的学习上面?这是因为我们对于真正的学习还有很多东西是不理解的,而数据驱动至少给了我们一个工具使得我们能够去做,产生了很多有效的案例。我们先做能够做得动的事情,会逐渐揭示出一些一般的规律。
我们做事情、做研究也是这样的——做一件特殊的事情,然后把特殊的事情逐渐搞懂,在这个基础之上,往往可以得到一些一般的规律。比如牛顿,他也不可能研究整个宇宙全部的内容,他只是通过专注研究行星的运动,然后发现了万有引力定律,这就是一个普遍规律。所以,研究通用学习也是类似的,我们能够真正做动的事情不多,但是研究数据驱动型的学习是我们目前能做的。我们通过认真研究,可以从中深挖一些规律,这些规律就有可能成为广而泛之的成果,这就是我们的目的。
【C君】:好,这个我理解。
【X君】:说到这里,我想强调一下,我在我的文章里提出了一个很明确的猜想:一个东西如果能够做比较广泛的学习(而不是只做一件事情),那么它里面一定要有一个特殊的内在结构,否则就做不成。这个猜想还未完全证明,但是我非常相信这是正确的。比如说人脑或者其他东西,只要能够做通用学习,就一定存在这样一个内在结构。现在深度学习很红火,谷歌把整个公司的前途都押在上面,花了很多精力。实际上,深度学习中也有这样一个内在结构做支撑。以后,我们要做更好的、更新的学习机,也必须要有这个内在结构在里面。我们用数学方式定义了这个内在结构,叫X-形式。我的猜想是说,广泛学习的内在结构一定是X-形式。
再回到刚才你讲的,功能结构驱动型的学习——怎么蹲下来爬过去、怎么伸手拿碗等等,这些都是学习里面的很多方方面面,太多了,但是我想这些最后都应该服从一个内在规律,必须要具备这个内在规律,才能做通用的学习。我也借此说明一下,目前我的这个工作只是做了一个开端,希望有更多的人去研究里面的规律。我们把猜想提出来,这是一个不错的进展,欢迎大家来看对还是不对。如果有人能证明或者证反,都是很有意义的,都是一个很好的促进。
刚才是把目的讲清楚了,就是我们为什么这么做的目的。再讲到X-形式,我下面把我为什么想到X-形式的思路做个介绍。
【C君】:OK,我继续互动。
【X君】:为什么形成X-形式的思路?这个思路应该很多人都模模糊糊有过,很多人、很多文章都模模糊糊有过。一旦我们从局限中跳出来之后,站高远一点,往往就能看清楚了。
【C君】:嗯,用我们中国的古话讲就是“不识庐山真面目,只缘身在此山中”。
【X君】:哈哈,对,“横看成岭侧成峰,远近高低各不同”。我们稍微站远一点来看。我们可以先从信息处理机看。人也一样,我可以学习,但是我可以随时处理信息。
【C君】:这里我理解一下,信息处理应该是学习的基础,学习机首先必须是信息处理机。我是不是可以这么理解?
【X君】:对,甚至我们可以想得更复杂一点。动物、植物都要处理信息,不然就活不下去。植物是另外一种方法,我们现在不说。以动物为例,有人研究了一种很简单的动物——一种海洋软体动物,它只有几个神经细胞,这几个神经细胞就起决定的作用——收缩还是不收缩——收缩就躲避敌害但是不进食,不收缩就可以继续吃东西,这就是一个典型的二分。这个最简单动物,它的基本生活逻辑就是一个二分。
我们仔细想,二分,要么这样,要么那样,实际上是一切一切的基础。当然不仅是一个二分,而是很多二分。人和机器都有很多二分。二分实际上是神经细胞的根本,任何神经细胞最基本的特征一定就是二分。我们把它加以数学抽象化,那就是布尔代数了。布尔代数做了差不多两百年,虽然看起来很简单,但是还是有很多问题没研究清楚。如果从这个角度来讲,要做信息处理一定是要研究和面对非常复杂的二分问题,因为里面有太多问题叠加在一起。
【C君】:在这一点上,我再简单互动一下。我认为X-形式中的核心思想就是基于二分的思想,我很认同这个观点。我们老谈图灵机、量子计算机、八进制、十进制等等,但是我觉得宇宙的核心逻辑就是二分,也是就是我们古代哲学道家的阴阳。阴阳也好、二分也好、二进制也好,这才是我们宇宙真正最基本的规律。从我自己的观点来讲,量子不是宇宙的本源,二进制才是最根本的,它才能够演绎智能。其实,人和动物分解下去就是这么简单的二分,很多二分形成了各种复杂体系;而且越二分,就越能统一各种事物。所以,我觉得这个理念是对的,这是根本点。
【X君】:你仔细看,二分真的是处理信息的根本。从牛顿起,甚至再早,整个数学都是连续数学的,当然连续有连续的道理,但是我们过多着重于连续了。我以前学数学,学的也都是连续数学,但是一直到最近若干年,我才发现这个二分比连续还要根本,就像你讲的阴阳,它真的就是世界的根。
【C君】:对,包括我们物理的最基本原理也是二分。
【X君】:是的,从最简单的动物起,就是二分;一旦二分多了,又会很复杂,可以超级复杂,就像人一样。追根溯源,我们从数学来讲,只要能抓住这个东西,就能抓住事物的本质。
【C君】:对,我想再补充一句,二分是无所不在的,有时候不是简单直观的。以人来讲,眼睛、鼻孔是二分对称的,那嘴巴呢?它跟屁眼也是一种二分成对,一进一出。所以二分不一定就是简单的横向或者竖向的空间二分,它是多视角的二分。这是我一个朴素的理解,哈哈。
【X君】:那肯定的,这就是我们提出X-形式的基本想法。我们提出来后,做了数学推演,这里我对X-形式做一个解释。布尔代数,200年前就有了。但是X-形式跟布尔代数之间有非常根本的不同——X-形式是主观的,不是客观的。我们研究机器学习一定要研究主观,没有主观,就不要做任何事情了。哪怕甚至是一个很简单的机器,都必须有自己的主观,它不是客观的,只有“上帝”是客观的。只要牵涉到人也好,机器也好,蚂蚁也好,或者任何一个动物,他们都是主观的,他们只能从自己的主观来看待外面的世界。
【C君】:我在你的那篇中文文章里看到了这个观点,这一点也是我体会最深刻的。基于二分的形式,把主观的思想用数学表达出来,我觉得这是该文章中很有意思的创新点。我们平时很多感知都是只可意会不可言传的——“好像是这样的啊!是这样的啊!”但是,怎么样用数学形式去表征这么一种对输入数据响应的主观和客观,我觉得这种基于二分法布尔代数的结构化设计是有意义的,我觉得这是X-形式里面中有价值的运算。说白了,里面有很多运算是既有存在的,但是有些运算是创新的,很有意思,这里面确实体现了主观思维的数学模型化。主观体系到底怎么去数学化描述,至少在这一点上是一种非常棒的尝试。
【X君】:对,是这样子的。这一点我们也可以比较自豪地说,目前从看到的文献来讲,如何描述主观的数学模型,我们是很前沿的。我的文章把主观是什么东西最清晰地用数学语言讲出来了。
刚才我讲的,任何都是主观的,只有“上帝”是客观的,因为“上帝”是无限的,不是说一定有“上帝”的存在,如果存在,那么他是无限的。
把两个布尔代数表达式加起来,或者相乘,或者因式分解等等,在布尔代数里面都可以做,没有问题。但是人未必能够做到。例如,一个东西和另外一个东西有相同的效果,在布尔代数就是一步计算,但是一个人往往需要很长的时间才能理解到,甚至绝大多数人完全理解不到。如果不能跨过主观极限,他永远就理解不到。“上帝”的视角,是一目了然的,一下子就看到这两个东西是相同的。
X-形式实际上很好地把主观的数学形式描述出来了,把这个局限性都讲清楚了。X-形式肯定需要很多发展。但是,我们非常清楚地描述了主观是由什么东西形成的:主观实际上是由我们内部的局限形成的,主观就是我们的局限性。
【C君】:嗯,最后这句话总结得非常深刻,这个颇有哲学高度。
【X君】:的确很有意思,这是研究的乐趣。接下来,那么,我们提出了X-形式,它实际上是起一个什么作用呢?它是承载学习的基础。其实我们可以问一下,不管什么东西,无论是人还是机器,他能够学习,那么他学习得到的东西是放在什么地方的?可以这么讲,人是放在大脑里面(究竟是什么其实也不清楚,但是可以抽象地这么讲),那么机器是放在什么地方呢?比如说,AlphaGo,本来什么都不知道,通过不断的数据驱动进行学习,它就学会了一些东西,那么它学会的这些东西放在什么地方?这是一个很根本的问题啊!所以,我们反反复复追问,这个学习的东西应该放在什么地方?只可能放在X-形式里面,这是我们的一个主要结果。
我们讲到深度学习,它的学习所得放在什么地方呢?其实是这样的,有一个很大的欧氏空间(几百万维以上),欧氏空间里面可以有很多内积,它把学习所得放在了这些内积的参数里面。这就问题很大。这样做是非常低效的,浪费了极大的算力;而且最重要的是,这些内积纠缠在一起,没有人能够说清楚里面在干什么事情。所以我们需要一个更好的承载形式,来承载学习所得,这就是X-形式。并且基于X-形式,我们也推导了一些有效的学习方法。
我停下来简单总结一下,之前我们讲了目的和基本思想,下面我想讲一下接下去我们要做的方向。
【C君】:这里,我想再互动一下,我想针对深度学习和X-形式再深入交流一下,我觉得这点很重要。
【X君】:好,好的!
【C君】:深度学习现在如日中天,在工业界、学术界、资本界都得到了大家积极的响应。我们来总结一下,为什么深度学习这些年突然在各个维度上形成这么大的响应,我谈谈个人的看法。
第一个,我觉得深度学习首先是构建在强大的物理逻辑框架的支撑基础上,包括GPU等等,这是一个基本的物质条件。
【X君】:对的,这个物质条件已经具备了。
【C君】:嗯,没有这个基本条件的话就是空的。那么,从我的理解,如果我们讨对图像做处理,深度学习其实就是对图像进行不同尺度的、不同区域范围的遍历,在遍历过程来提取特征,把这些特征之间再构建一个相关性。
【X君】:完全可以这样理解。
【C君】:但是,深度学习有个显著的特点,必须给它抽象出显著的可表征的数据模型才行,比如数据标识,如果数据本身的特征是只可意会不可言传的,就无法用深度学习来处理。举个简单的例子,地质灾害,就没有显著的特征去描述什么叫地质灾害;而人脸就没有问题,比如眼睛、鼻子、耳朵等等,它有稳定的结构化模型。如果一百个漫画家画赵本山的漫画,形态各异,人一看就知道是谁,但是这些漫画的几何特征不具有简明的标注,所以深度学习就无法识别。
深度学习得以发展的第二个重要条件就是数据。当今有大量的数据,为深度学习提供了支撑。比如图像识别,就需要准备很多标准化的测试数据或者训练数据。而数据的准备也是需要有条件的,这个条件的满足是需要成本的,基本是与数据量线性相关的,但是数据的增长却是非线性的,因此后续的成本将是无与伦比的。
【X君】:对,数据成本非常大。
【C君】:第三个就是算法。对于神经网络,我理解X-形式也是一种类似的网络。因为X-形式把所有运算以二进制的模式进行描述,这点很重要,因为我们想要统一,首先得把复杂的化为简单的,否则就统一不了。就像我们研究三维,针对协同设计,他们总是觉得人要去互动、去协同,我觉得错了,其实协同的核心在于模型内在逻辑要保持一致,只要模型一致了就自然协同了。
我觉得深度学习如此发展,就是这三个因素的产物——强大的物理逻辑支撑、强大的数据体系,还有就是软件体系,现在的算法和软件开发功能很强大,经过了几十年的积累。这三个基础构建了运行框架,再加上神经网络的思想以及深度学习、卷积神经网络、高斯公式等算法的支撑,能够把逻辑数据串起来,所以就表现出了一种学习的能力。
从我的理解,X-形式的角色在哪里?它能够更大程度地把复杂问题的逻辑特征通用化,变为二进制的模式。我也在研究语义智能,其实人判断的核心在于价值利益的取向,其本质上也是X-形式,也是一个二进制模型。只是,我还没有类似去构建一个统一的二进制的概念,咱们从不同维度都去做了一些实践与尝试。
【X君】:好,你这个讲的非常好,对我有很多启发。我接着我的思路讲,我们X-形式已经提出来了,而且也构建了一些使X-形式运用起来的方法。这里,我要强调一点:实际上X-形式目前来讲还是比较初等的,最重要的发展是要实现成工程模型。数学的东西有了,工程原型也有了,我们也申请了专利,现在需要做成工程的样机。如果倒退十年,我可以自己做。现在来讲,我必须要找到真正的高手,把工程样机做出来。实际上也就是一两个高手的工作,没有高手,人多了反而不好。样机出来后,就可以进行工程实践,一旦产生良好效果之后,就会形成一股新的潮流。希望找到一两个年轻的高手一起完成这件事情。就是想做一个宣传,如果有程序高手,这方面有很高的能力,有很好的想法,欢迎跟我们一起完成这个事情。
【C君】:好的,咱们期待,哈哈。
【X君】:我们讲了四十几分钟了,前面基本上是围绕我的文章来讲,文章的前部分基本讲完了。文章的后面部分,我想特别再强调一下,我设计了四个学习的策略。
策略一:类似于深度学习,实际上给深度学习奠定了一个更好的数学基础,解释了它究竟在干什么事情、为什么会有效。对于一个问题,如果有足够的数据,就是数据满足“足以支持、足以包围”两个条件,就一定能够学会这件事情。策略一实际上是对深度学习更明确的数学解释。
策略二:我们提出了一系列的方法,这就不是深度学习了。策略二更进了一步,有可能会比深度学习做的更好。数据条件也是“足以支撑、足以包围”,这点跟策略一是一样的,但是策略二要灵活很多。我们提出了一个很明确的方法,叫做逐级抽象。
相比深度学习,策略二有非常好的特点——
第一个特点是不需要预设,而深度学习最大的问题之一在于它必须要预设才能学习,这是一个非常大的区别。
第二个特点是,策略二可以做得更灵活,因为有逐级抽象,而且可以解析。而深度学习是知其然却不知其所以然的——我知道它可以这样做,但是不知道为什么它这样做。但是如果策略二做出来的话,就既可以知其然也可以知其所以然了。
【C君】:这点上,我想再打断互动一下。策略二的逐级抽象的思路肯定是对的,但是怎么去抽象?我认为这本身不是用X-形式能去解决的。不知道这样理解是否正确?
【X君】:没错,是这么理解的。
【C君】:它需要其他技术为X-形式做支撑。因为我也做了很多相关研究,我深刻理解这句话的含义。从我来讲,X-形式的核心是把所有的东西找到一种统一的连接的表征模型,把主观和客观放在一起,但是它是建立在很多其他基础研究上的。现在是反过来,我们在想着如何通过X-形式的引导,使得其他研究向X-形式靠拢,起到这么一个角色。我是这么理解的。
【X君】:对,你的理解完全正确。X-形式只是一个承载体,去承载学习的东西和内容,但是学习本身还需要其他的方法来支撑,包括抽象的模式等等,这个是肯定的。策略二,实际上提出来一种新的方法,用同样的数据,但是可以做的更好。我们又提出了策略三,数据可以更少,但是对学习机的要求就高了。就好比人,聪明的人可以通过较少的数据就能快速掌握知识。然后,我们又提出了策略四,那就又更进一步了,会更好很多。
策略一已经实现了,因为深度学习就是策略一。策略二、三、四都还没有实现,主要是因为还没有X-形式的工程样机。一旦有了这个工程样机,我想后续这些策略都是可以实现的。
【C君】:嗯,我大概理解这些意思,但是我有一点不同的看法。我觉得,哪怕是X-形式的工程样机出来,后续还是会有很多瓶颈性难题,如果这些难题不突破的话可能还是很难去整合的,这是我的想法。
【X君】:你说的对,肯定会有瓶颈问题,肯定会有更深的问题。但是,从要求的高低来讲,我们目前可以非常清晰地看到,这是一定可以做的事情。只要有充分的数据,就一定能够做到,但是以后的发展是用更少的数据。那么,有了X-形式的样机之后,深度学习能做的,我们都能够做,这是肯定没有问题的。问题仅在于,是不是可以做得更好,这就有很多的发展和工作要去做。
【C君】:这点我是认同的。X-形式是很好的设想,从哲学层面上也说得通,而且实际上,它有一个很好的特点——体现了主观和客观在二进制上的一致性。通过X-形式的样机,推动相关支撑技术的发展是肯定的,但是还有一些其他领域的挑战,这会是另外一种难度。总体来说,我认同刚才讲的这四个策略,是逐渐提升递归的过程。
【X君】:嗯,肯定以后还有更多、更好的策略。这里我讲另一件事情,我这篇文章,目前所谈的学习内容只跟空间有关,跟时间还完全没有关系。为什么这么做?我是先考虑简单的事情,故意还没考虑时间。但是时间的问题很重要,以后肯定要发展跟时间有关的模型。这也是我下一篇文章要做的。
【C君】:好,我们拭目以待。
【X君】:但是,如果只考虑空间,本身也有很多重大用处,很多问题是只需要考虑空间的。举例来讲,你刚才讲到地质灾害,我们有可能用通用学习机做出一个与地灾有关的数学模型;地质灾害实际上就是很多条件叠加在一样,产生滑坡等,这些就人来讲,困难程度很大,因为因素太多,正确地综合起来的难度很大,尤其对于不那么专业的人来说。所以,如果有足够的数据支撑下,说不定就能自动判断是否有地质灾害风险,这就是一个空间模型,可以不涉及时间的问题。
【C君】:对,我觉得是有可能的。X-形式我们也聊的很细了,咱们也谈到了空间知觉与X-形式。关于X形式与空间知觉之间的关系,我想我们可以再展开谈谈。
【X君】:好好好!人对于周围空间是有知觉的,动物也有,这实际上跟我们刚才的话题有很深的联系。我们想一件简单的事情:一维的动物生活在一维空间里,比如一只虫子只能在线上运动,它对远近距离是可以产生知觉的。那么,它是怎么样产生空间距离知觉的?
【C君】:我插一句,这个问题剖析很好,其实这正是当前视觉认知领域研究的一个很基本的问题。
【X君】:对,实际上,人和动物都跟所处的空间环境有关——如果生活在三维空间,就有可能学习认识三维空间的特征;如果生活在二维空间,就有可能学习认识二维空间的特征;如果生活在一维空间,就能学习认识一维空间的特征。那么,如果生活在四维空间,能否学习认识四维空间的特征呢?我认为当然是可以的。人现在没有四维空间去做,但是如果我们做一个机器人,让它学习理解四维空间里面的东西——这也是我跟很多数学家说的事情:研究四维空间,凭借想象,做很多抽象,其实很多问题想不清楚;如果我的通用学习机做出来了,让它在四维空间里面去想,那么很多定理就很容易证明了。嘿嘿,是这样的。
【C君】:这是一个很奇妙的设想。为什么我们研究四维空间的时候往往产生很多问题?因为我们被三维空间深刻地“污染”了,在研究四维空间问题的时候,很容易映射到三维空间。
【X君】:对,是这样的,很多问题想不到,描述起来就非常困难了。我们再回到一维空间,它产生空间知觉,那么一定需要一个内部的学习承载体,另外它还需要能够感受距离的结构,比如说眼睛看过去或者超声波射出去,这些大量数据输入进来,然后内部产生一个抽象过程,针对很多数据进行分类、整理、抽象,它就得到了距离的概念。比如说蚂蚁,它不那么聪明,但是它的确有空间距离的概念。我们设计一个机器人,只能在一维空间里运动,但是它能产生超声波或者眼睛能够看,它也一定能够逐渐抽象出一个距离的概念——从这里到那里有多远、过去需要多长的时间等等。它在这个空间里面生活,能够产生各种反馈信息,然后它对这些信息进行加工处理,最后就能获得空间概念。
刚才讲的是一种最理想的情况,但是对动物来讲,这个理想的情况它是做到了,但不是它自己一辈子做到的。比如说,蚂蚁不可能是通过自己的学习做到的,而是通过祖祖辈辈的积累做到的,它的内部结构是一个死的东西,是通过遗传得到的。就是说,它的确有空间概念,但是这个空间概念是固定的,不可能变动;如果要灵活的变化的空间概念,这个要求就很高了。这是我的想法,我觉得空间的知觉应该从这个角度去理解。
【C君】:我觉得这个剖析得很有意思,不过我有一点看法想互动一下。这个观点中,像蚂蚁这样简单的动物没法去学习空间形成知觉,可能是通过祖辈的遗传,获得群体的经验。原则上我理解,但是我认为,不管任何动物,遗传了什么样的空间能力,最后都需要通过自己的实践来再掌握。也就是说,它还是学习了的,只是说它学习的扩展空间很小,被固化在了祖传的配置中。我想这么去理解是不是会更准确一点?
【X君】:对,肯定是有学习的过程,但是弹性有多大,是有差异的。
【C君】:是,弹性和逻辑支撑体系是由祖传选择进化得到的,无法去改变。但是,它诞生下来,基于这个逻辑支撑框架,需要通过自己的感知去学习。所以有的动物能力强一点,有的能力弱一点,会存在个体的差异性。这是我的理解和观点。
【X君】:完全正确。说到这里,我们在文章中也是明确提出了,学习机要分级。比如一级学习机,它可以学习,但是它的学习机理是固定的。就是说它可以学习,但是它学习东西的东西是不可以动的。那么,我们人显然就不是这样的,包括动物来讲,都不是一级学习机。但是一级学习机有什么好处嘞?把机器做成一级学习机,有非常重大的好处,就是我们可以精确地把握它。有人担心未来机器人的灾难,如果我们把机器人控制在一级学习机,就永远不会出现这个问题,它永远不会失控,嘿嘿。
【C君】:嗯,好的,好的。我是觉得,通过这些交流理解,比较全面深刻理解了关于通用学习机的一些很棒的成果和思想。
【X君】:哈哈,谢谢,我们一起探讨。
【C君】:我们之间互动交流一转眼就快四个月了,这次是我们约定交流的第三次,再结合我多次拜读相关文章,我觉得通用学习机是一个不错的设想和创新点,也对我颇有启发。包括你谈到的感知、知觉与学习等,不管从什么形式来感知学习,其实它必定是存在某种内在结构的,这种内在结构的基本逻辑之一应该满足X-形式,我觉得是这个是对的。不过,通过什么方式关联实现,这还需要做很多很多的研究工作,这将是巨大的挑战。
【X君】:嗯,有很多挑战在前面,很多工作要去做。哈哈,我们聊得很好!不知不觉也聊一个多小时了,以后我们有机会再继续探讨。
【C君】:好的好的,到时候我们再约。
【X君】:好,你也早点休息。
本对话由C君记录整理,X君做了一些修改。