X君与C君关于空间智能重构与通用学习机的对话(之一)

【背景】:X君是数学家,研究通用学习机,在纽约。C君是3D+大数据+智能领域科学家,研发空间智能重构和相关的软件,在北京。X君与C君在网络上认识,尚未谋面。二人对彼此相关理论成果与思想有所理解后,均感有趣,希望进一步交流。于是相约了一场跨太平洋对话。初步设想就三个专题进行:①以C君为主X君为辅,对谈空间智能重构;②以X君为主C君为辅,对谈人与动物的空间感;③以X君为主C君为辅,对谈通用学习机及空间智能重构。

北京时间2017年12月11日23:30左右,X君与C君开启了本次跨洋电话对话之旅。

【C君】:上午好!(北京与纽约的时差大致13小时左右)。

【X君】:晚上好!信号不错……你在中国,我在美国,我们今天隔着时差越洋交流,那我们就直入主题如何?

【C君】:OK。下面,我分四个点对谈。

【X君】:电话沟通,只闻其声、不见其人,为效率起见,我提议几点沟通准则:一是“主讲人说话时,听者尽量不打岔”;二是“每句话不要太长,有利听者理解和互动”;三是“对话的效果是自己有趣、理解对方”;四是“对话沟通中可能形成三层结果:不理解、理解、理解并认同,我们对话时,尽量做到沟通中理解,但是不必认同”。

【C君】:这个建议好,我认同,那我先讲了。

在谈空间智能重构前,我先要说个观点: “宇宙中只存在三维空间”, “时间只是针对特定变化三维空间的一种度量属性”;这观点是我对话的一个关键基础。

【X君】:第二点有些绕,要复述一遍,我先写下来……(C君重述一遍)。

……嗯,现在,我复述一下我的理解(X君复述了他的理解)……

【C君】:基本就这个意思。

【X君】:我理解你的表达,但是这个关于时间的观点我们这里不必谈。事实上,有物理学家也持这样的观点。

【C君】:现在,我谈谈对“数学空间”概念体系的几点理解,有点班门弄斧!

我认为,现代“数学空间”概念体系分三个层次——三维几何空间、N维线性空间和广义数学空间。

“三维几何空间”:实质是以地球为参照系的相对三维空间所抽象出的三维几何空间。

“N维线性空间”:是基于“三维几何空间”所抽象,核心是正交向量基的概念,有三要点:一是正交向量基的独立非相关性,二是正交向量基的方向性(即N维向量性),三是正交向量基的合成性(即任意N维向量的可分解性)。

【X君】:这个描述可以理解,也没大问题,应该是数学界可公认的。

【C君】:OK,那我再谈一下广义数学空间。

数学家们抽象的广义数学空间无所不在,比如:基于个体与组合关系,抽象出了集合空间概念;基于不同特征变量之间映射关系,抽象出了函数空间概念;基于认知结果的不确定性,抽象出来了概率空间概念,等等。

【X君】:理解。数学是人类的思考工具,在现实空间中不会有一对一的存在。而且每个数学家讲的东西都不会完全一样。

我很赞同某个西方学者的观点(这个人在中国不太有名)——数学实际上分成几个大方面,每一个方面都跟人内心有关。其中一个方向就是概率方向;概率的根基在于:人在行动或者思考的时候会犹豫,概率是就是从犹豫心理中抽象发展出来的。

【C君】:这个视角非常独特,也挺有意思!

在此,我想表达一个可能让数学家们不太喜欢的观点:数学所抽象出的概念定义,与每个现实问题并不是一一对应的,大致可分为三种情况:第一是对目前现实问题的抽象;第二是暂时没有发现对应的,但是未来现实中会出现的;第三是在宇宙永远都不会存在对应的。我把第三类现象称之为数学理论过度抽象。

在实践中,如果应用被过度抽象的数学理论时,往往会对解决实际问题成误导,反而造成障碍。数学源于生活、高于生活,也要回归生活、服务生活,这是我对数学价值的一点思考吧。

【X君】:这个观点,理解。

很好!通过刚才的互动,我感觉我们可以开始谈你的空间重构概念了。

聚焦一下今天对话主题,有些问题可再搞专题交流。我们先来搞明白各自的空间重构概念是否一致。

我再理解一下:你想表达空间重构的意思是:“基于对周围事物所反馈的信息,重构相应的三维空间?”

【C君】:这与我所想的差不多吧——基于真实三维几何空间,通过可探测获得特定位置上分布的属性信息(或叫输入),通过算法,智能化重构出空间整体分布属性。

【X君】:理解。那我们的理解基本是一致了。

【C君】:下面我们结合实际应用,讲空间智能重构问题。

人类社会认知自然现象,除了概念空间、抽象空间之外,很多实质都是真实三维几何空间认知问题。

比如,地质体、气象体、海洋体、人体等等,本质是一个三维上的空间智能重构问题;是社会发展的痛点与难点,市场价值极大。

【X君】:这个需要你展开说说。

【C君】:我先说一个总结——现代数学分析计算中,一般来说,大尺度问题(或复杂系统)做定性;小尺度问题(或简单系统)才做定量。

比如:大尺度区域10公里*10公里,高度1000米空间范围,做气象数值计算时,单元网格剖分:水平向按100米、高度向按10米,单元节点就达1百万;每个节点X、Y、Z三个自由度,则有3百万个待计算的变量自由度。数值计算矩阵达3百万*3百万,这么大矩阵是需要顶级超级计算机的。而且平面100米单元间隔,容易导致100范围的小山头被忽略掉,局部点的气象分布计算肯定不准;这样花费巨大成本的定量数值计算,实质至多是一种大尺度低精度定量分析。

我认为,这类问题解决,是需要回归到宇宙本源来思考。

【X君】:大尺度定性和小尺度定量的大体说法,是个谈话点,不过暂时不谈。

关于复杂问题解决需要回归宇宙本源的概念,可再展开解释。

【C君】:举地质问题说吧。

地质体空间中地层属性的分布,千差万别;但地质体的成因背景,是有逻辑的,比如:岩石的风化、洪水带来沙与土的流动等等。从地质这种成因逻辑出发,地质专家可以找出自己理解的特征和规律。

计算机分析时却面临很大瓶颈:一方面这些规律是定性的,难量化,数学家们很难抽象出数学物理方程;另一方面,这些地质特征不是显性特征,是地质专家的想象特征,现有以深度学习为代表的人工智能技术,无法去识别。如果局限在这两个方向,就有进退维谷之感。

但是,如果换一个思路:所有这些特征,不管怎么复杂,都把它映射到真实的三维地质体几何空间,很多问题可能就迎刃而解了。

这也是我前面探讨几何空间,并把空间划分三个层次的出发点。

【X君】:我好像把握到一点了。联想到上面我们谈的大尺度系统,如果采用现有数学理论,用高度抽象方法来做,可能会出现问题;比如抽象过度、忽略细节等;如果回归到真实的三维空间中,问题可能也就迎刃而解。这个观点,我理解并认同。关键在于你的接下来的解决思路如何?又有何优势?

【C君】:我的解决思路大致是:

第一点:在任何真实三维空间,针对任何三维属性类型,直接建立边界属性信息(输入信息)与三维空间体间的广义关联性;实现三维空间体属性分布的智能化建模。

第二点:针对属性分布模型在三维空间体中任意局部位置,建立特征的广义关联性,实现属性特征的智能化提取。

第三点:针对从局部边界信息(输入),在三维空间体分布的不均衡性,或者局部几何空间中特征提取的不均匀性,建立柔化变换算子,智能化确保局部到整体的协调性。

这三点,我认为是空间智能重构思想的核心。

【X君】:很好,我们的理解开始渐渐深入了,不过听着还是有些抽象,没理解透,可否举个实例来说明。

【C君】:好,还是以地质空间重构为例。

比如纽约市地区——需要建立整体地质体模型(约20年前,世界发达国家就启动了各国玻璃地球计划,实质就是这事,但进展缓慢)。

【X君】:地质领域我不懂,我试着理解一下——假设面对的是全部曼哈顿岛的地下几何体,简单情况下,把它分为AB两种地层,空间重构就是描述AB之间的空间边界。也就是根据获得的信息,把这些复杂边界描述出来?

【C君】:是的!但是要解决这个问题,难度却很大——

第一,曼哈顿的地下看不见、摸不着的,只能通过打些钻孔,得到局部位置地层分布;

第二,钻孔成本高,取孔有限,导致钻孔信息分布密度小于1/万;

第三, AB两种地层在曼哈顿地下是犬牙交错的,不是简单层状形态。

A地层三维矢量模型

B地层三维矢量模型

AB两种地层整体三维地质体模型

现有数学方法,没法定量重构出曼哈顿的整体地质体模型。

如果采用广义关联性方法,针对曼哈顿的钻孔与整个地质体之间,就可以智能化构建曼哈顿整体地质体模型。

【X君】:理解。那这个广义关联模型的概念,是你自己提出的?

【C君】:是我们自己创新提出的。

【X君】:很好!我们今天讲的空间智能重构,本身就是一门很有趣的数学学问,而且有实用价值。你的核心点是广义关联模型,那我们就这个话题继续深入交流。

在我看来,这些已知信息是非常有限的,通过有限的钻孔去推导更多的信息,是采用广义关联模型来解决的。不过针对少量的已知量对大量的未知量与进行预测,结果很可能是错的。由错到对,广义关联模型是如何做到的?

【C君】:这个问题非常敏锐,点到穴位了。

基于局部推导整体时,地质学家有两类支撑信息——钻孔类信息和专家地质背景类信息。

地球体几十亿来的地质体形成,归纳起来大致也就有五六种主要成因,从这些成因出发,可以综合抽象出参数化描述,然后基于钻孔类信息,对整体地质体进行反演,这种反演结果要求与实际地质空间,达到比较高的重合率,才具有实际应用价值。

广义关联模型干的就是这件事情。

【X君】:那广义关联模型的核心是什么?

【C君】:核心是把专家基于地质背景的定性参数化信息,和钻孔类信息统一关联,智能化实现地质体重构。

【X君】:是类似于专家思考方式?通过对专家知识的学习,结合钻孔类信息,进行智能化重构。

那这个广义关联模型说不定还能再抽象一下,从地质重构抽象出更高层次的数学理论。

【C君】:是的,但我们已经抽象出了一套数学理论体系,并发现这类地质体空间重构方法,是所有三维空间上实现属性分布重构的通解,只是关键成果还没有公开发表。

这个理论,我们取有名字,叫做“后现代三大算法——泛权、泛换与柔换”。

【X君】:不错!那这个理论有验证或实际应用吗?

【C君】:我们团队应用后现代三大算法,针对三维地质智能建模已开发出产品,并已应用,市场反馈很不错!针对三维激光点云特征智能提取,开发了原型系统,算法验证也很有效;也还有一些其它领域的应用突破,感兴趣可另外再交流。

【X君】:有意思!针对地质领域能够做出应用产品,这本身就是对理论的一个很好的印证;无论什么理论,终究要回归到解决社会实践问题,这很好。

不过,我得先喝杯水了,不要挂断……

【C君】:是该喝口水了!……

【X君】:(喝完水)好了,那就简单谈谈你们的后现代三大算法。

【C君】:后现代三大算法中,泛权算法是以广义关联为核心的算法;泛换算法是针对局部特征的智能识别;柔换算法是解决局部到整体,以及整体中提取局部特征时的协调性。

【X君】:请展开讲一下泛权算法。

【C君】:泛权算法是我1999年5月的某天,当时正是博士毕业提前在工作单位实习,突然灵光一现得到启发,并结合模糊、概率、神经网络等数学思想,发展出了这套算法。

【X君】:这样讲,还是不好理解。有无具体例子?

【C君】:OK,举个例子,还是以地质建模为例。

在已知钻孔信息与地质体中地层属性未知点之间,我们研究发现,地质属性是基于距离和地质背景信息的一种模糊相近关系,我们提出了自己的特定算子(我们自己叫他模糊算子),来建立起已知与未知之间的广义关联度量体系。

题外话,相似性、相近性与模糊性,三者实质一致,只是形式有差异,都是人类智能学习中的关键特性。

【X君】:比如在曼哈顿钻了一个孔,这是非常精确的;但是远离钻孔100米,就是未知的了;这时候需要构建已知孔与未知处的推导函数,推广到全岛,是这样理解吧?

【C君】:对。当有很多钻孔时,地质专家进行整体认知,会遇到很大的挑战:

第一,钻孔地层分布是连续的、犬牙交错的,比如不同钻孔的某高度到某高度连续是地层A,某高度到某高度连续是地层B,再某高度到某高度又连续是地层A,等等。

第二,几千个或者上万个钻孔更多钻孔,而每个钻孔有几十到几百个的地层,形成复杂的空间边界(输入)。

第三,这些钻孔在区域中平面和高度上,分布都是很不均匀。

第四,钻孔占整体三维几何空间的已知信息量极小,通常小于万分之一。

我们通过一个算子,克服了这些难点,在钻孔与任意点间,建立起广义关联度量模型,这是广义关联性的核心点。

【X君】:是不是可以这样理解,曼哈顿钻了100个孔,有一个算子,基于这100个信息推导到整体,这个东西叫做泛权,对不对?

【C君】:对。这个地质建模过程中,还有更麻烦的事。

现有数值计算中,比如有限元、差分元、边界元等,已知边界是需要先离散化为单元节点的;但泛权方法建模时不需要这样离散化。

泛权算法智能建模的一个特点是,把专家的背景信息参数化,当把它融入建模时,能够达到与专家一样的效果。

【X君】:理解。我来描述一下,比如有一个几何空间,对它进行钻孔取样,然后重构整体,这只是一种推演,不过是有根据的推演;在这个推演过程中,需要什么方程?

【C君】:我们不需要去迭代求解方程。有点类似于神经网络的思想,全部已知边界信息自动构成动态网络结构,一旦输入已知地质信息时,就可智能化输出三维地质体重构模型,实质是地质属性自适应的空间分类聚合问题。

【X君】:神经网络参数是固定的、还是变动的?

【C君】:是自调整变动的、自适应的。

【X君】:那这就是学习了。这个神经网络有多大?有多少层?多少个节点?

【C君】:目前最多不超过5层,节点数跟钻孔边界有关,不是固定的。

我们这个智能结构,不需要前期大量测试数据的支持,也就是说基本不需要训练。

【X君】:输出有多少?

【C君】:可以根据任意空间点输出相关的属性分布结果。

 

【X君】:神经网络的节点是有连结的,连结之间是有权的,那这个神经网络结构是如何考虑的?

【C君】:与这个传统结构,有些不一样。

【X君】:那样的话,就不合适再叫神经网络了,恐怕需要选择一个新名词。否则,用大家都用的名词,但是内容又有很大不同,别人就会说不对;而且会使得前来学习了解的人感到困惑。学术上都有门派的,需要尊重人家门派。这样就会使得推广更容易。

学术讨论的目的不是跟别人争论,不是谁赢谁输;而是真正要学到东西、对我们的思想产生冲击、启发和促进。

OK,我对你说的这个泛权算法大概有了一个初步的了解,就是说你有一个类似于神经网络的东西,当钻孔信息进来后,这个东西就前向产生了其他的信息,这个前向产生的过程不是求解微分方程,而是结合专家知识做出的推演。如果不涉及保密,是否发几个你们对外公开的公式来看看?一个公式,能够解决问题是很好的,如果再进一步,还能解决其他的问题,那就更好。

【C君】:很对。

【X君】:目前这个地质智能建模技术应用时的精度如何?

【C君】:2016年,国内某985大学,对地质智能建模技术的应用精度作了系统验证;验证结果表明:正常工程勘察项目的地质资料输进去,就可以智能化得到三维地质体模型;通过实际对比分析,准确率大概在70%,超出了地质专家的最高水平,远超出同类国际软件产品的水平。

【X君】:把钻孔资料输进去来重构地质体,有70%的准确率。如果再打钻孔,会不会提高准确率?

【C君】:是的,根据新增钻孔动态调整地质体模型。就是动态地质建模问题。

【X君】:理解。建议你们突出这一点。因为这一点是决定成本的关键。其实是做到了专家的事情,而且可以有自我学习提升的能力。

【C君】:是的。而且地质专家只能做二维的地质剖面,三维都是在地质专家大脑中形成的,那是只可意会不可言传的三维模型。如果钻孔数量更多,达到几千个以上,地质专家的脑袋也就很难适应了。

【X君】:今天我们探讨的这些理论,已经做出了实际应用产品,真的是非常好!

【C君】:泛换算法在激光点云数据智能处理中的应用,也是一个不错的案例。

就像吃饭一样,贫穷年代吃不饱,现代人怕吃胖;从前测绘点信息稀缺昂贵,现在激光雷达设备每秒采集几十万个点云数据,但是数据智能化处理,在国际范围内,仍是很大难题。

【X君】:太好了!点云相关智能技术,也是一个很难且有巨大产业前景的领域,我也有过一些研究,留着下次我们交流吧。今天内容已经很多了,很有意思,要不今天对话先这样?

【C君】:好的,今天对话对我来说,既有趣,也很有收获;期待下一次对话!

夜深了,已差不多是北京时间凌晨1点,X君与C君挂断了本次跨洋电话…….

 

 

本对话由C君记录整理,X君做了一些修改。

 

发表我的评论

Hi,请填写昵称和邮箱!

取消评论
代码 贴图 加粗 链接 删除线 签到