首页 汽车文章正文

李德毅院士:人类的四种基本认知模式

汽车 2024年07月16日 12:42 336 admin

编者按

人类认知的整个活动,就是如何解释、解决人类在生存和繁衍过程中所遇到的现实问题。OODA环是指挥控制领域的经典认知模式。2021年李德毅院士就在第九届中国指挥控制大会作主旨报告“对OODA环的再认识——用脑和认知科学解开博伊德环之谜”。近期,李院士明确提出人类认知的4种基本模式:记忆驱动的经验模式(OOA)、知识驱动的推理模式(OODA)、联想驱动的创造模式(OOCA)以及假说驱动的发现模式(OOHA),用这4个相对独立的认知模式来完成认知的形式化。这也为未来指挥控制的研究带来了新的启发思路。

认知的形式化

◇李德毅1郑思仪2黄立威3刘玉超4

1.清华大学计算机科学与技术系,北京100036;

2.北京中科原动力科技有限公司,北京100085;

3.北京市遥感信息研究所,北京100192;

4.中国指挥与控制学会,北京100089

摘要

人类认知的整个活动,就是如何解释、解决人类在生存和繁衍过程中所遇到的现实问题。通过分析古今中外著名的认知案例,概括人类认知的4种基本模式为记忆驱动的经验模式(OOA)、知识驱动的推理模式(OODA)、联想驱动的创造模式(OOCA)以及假说驱动的发现模式(OOHA),用这4个相对独立的认知模式来完成认知的形式化,OOA和OOCA两个模式是由下而上思维,从物理空间转向认知空间;OODA和OOHA两个模式是由上而下思维,从认知空间转向物理空间。4个模式发生的频度不同,相互之间的转换带有不确定性,共同构成了趋于统一的无尽认知。认知的形式化为构建可交互、会学习和自成长的新一代人工智能系统架构奠定了基础。

关键词:认知形式化;认知螺旋;迭代;多元认知;认知模式;自成长

中图分类号:B812.2文献标识码:A

文章编号:1009-2412(2024)02-0001-14

DOI:10.3969/j.issn.1009-2412.2024.02.001

1认知的螺旋式过程

著名的法国启蒙思想家、哲学家和教育家卢梭

说,“人生而自由,却无往不在枷锁之中”[1]。思想生而自由,却又无处不在形式化之中,这很好地诠释了“以约束为前提”的思维。所以,认知离不开形式化。认知是学习以及解释、解决现实问题的能力,而学习的能力常常是解释、解决预设问题的能力,预设问题就是现实问题的形式化[2]。

人类和其他生物相比,以抽象、联想和交互见长,但人类能否把宇宙的奥秘探寻清楚仍然是个谜。在宇宙这个巨大的物理空间中,绝大多数的物质硬构体是自在的,并不是以人为本的。人的本性是求知,杰出科学家和工程师都有一个基本的信念,即相信宇宙在本质上是有秩序的和可认知的,这是一切科学工作的基础。物理学家阿尔伯特·爱因斯坦说,“宇宙最不可理解之处是它是可理解的”[3]。但一个人在宇宙里的地位太过渺小,在有限短暂的生命中要认知无限是一件十分困难的事情。人类能够通过文明、文化的传承,形成科学的理论,解释如此广袤的宇宙,站在牛顿、爱因斯坦、达尔文等科学巨人的肩膀上,继续探索,就能够把越来越多的未知变成已知。“可理解”本质上是人类认知的群体共识,尽管人类认知的道路曲折,对于千万年前还不可理解的事物,因为“知识断层”或者“学科断层”等诸多因素,现在人类可能也仅理解了其中的一部分,但却是在逼近真理。

人类认知的整个活动,就是如何解释、解决人类在生存和繁衍过程中所遇到的现实问题[4]。每一次完整的认知活动可以分为感知、思维和行为个阶段。感知是认知的源泉,思维是认知空间里的内在思考,行为是认知的目的和外化表现[5]。无论是认知自然的能力,还是认知人文的精神,都不是与生俱来的物质存在,它自成体系,比物理空间更为深远广阔。认知活动不停地在物理空间和认知空间循环交互,以回答“在哪里”“是什么”“为什么”“怎么做”等问题。近300万年,人类大脑容积激增、大脑皮层组织与功能爆发式进化,使得人类认知有了生物学基础。尤其是近10000年以来,人类发明了语言、文字、工具、教育、科技,产生了文化和文明,群体认知所积累的人工智能对环境生态的改变虽然微弱,但使人类看到了未来的希望。每个人都有一个由生物学意义进化而来的、基于大脑皮层复杂神经网络形成的认知空间[6],在其成长与生活环境里,通过具身行为与物理空间及其他人进行交互。其在成长过程中,接受教育,学习科学和技术,吸收群体的智能,并通过自己的思维和实践,不停地修饰、修剪或重塑大脑皮层神经网络细胞及连接,形成了个体独特的认知。

1.1时间是认知的基石

宇宙一直处在运动和变化中,在人类创造出时间概念之前,生物在地球上出现之前或者灭绝之后,这些运动和变化都一直延续[7]。宇宙里没有绝对时间,同一个时钟放置在宇宙的不同位置呈现不同的时间,时间不能完全脱离和独立于空间。但对人类来说,进化使大脑有了分工的记忆区,包括瞬时记忆区、工作记忆区和长期记忆区[8],正是记忆让人类延续了过去和现在的认知,从而区分过去和现在。历史就是过去的现在,现在又将成为过去。以史为镜,这是人类高等生物群体特有的认知方法。时间不是物质,可以用年月日时分秒表达时刻,用高精度的时钟度量时间间隔,时间不是发现,而是发明。时间是物质变化和运动顺序的表现,用来形容物体或者天体的运动,用来描述人类自身进化的历史和文明,用来度量从有序走向无序的熵增过程。反过来,正是这些描述或度量让人类感受到了时间的存在。

认知机器包括物质、能量、结构和时间4个基

本要素[9],其中时间对于机器的认知至关重要,机器在没有能量供给的时候是一堆死物质。时钟依赖能量,时间依赖时钟,秩序依赖时间,机器自举实现思维自动化,自我复用实现认知自成长,机器运行靠程序,程序靠时序,软件靠交互,时序和交互产生负熵,机器赖负熵为生。时钟不停,与外界交互不息,思维和认知不止。机器之所以能思维,是因为至少存在下一个时间周期,使得机器能继续去“想”,人的思维和机器的思维在数学上是同构的[10]。

只有人类依靠想象力和创造力发明了时间,人类才能够认知时间、标记时间并度量时间,用时间来记忆、记录和解释宇宙天体的运动变化、物质的化学变化、物体的空间变化、生物的机体变化,以及人类社会自身文明的发展等。时间成为认知空间不可或缺的要素,是认知的基石。

1.2数学是认知最抽象的语言

宇宙有运动,运动有秩序。宇宙里没有数学,数学却可以解释宇宙。对宇宙本身而言,数学没有意义,对人类来说,数学是现实世界的主观反映。思维的核心是抽象、联想和交互,抽象是结构形成的基础。科学的各个学科都有自己的专业语言,但自然语言是所有专业语言的元语言。思维的最高形式是数学,数学是人类自然语言的高阶形态,是建立在明确的公设定理体系之上的。通过数学反映万物,通过函数和泛函反映万物之间的关联,形成人类认知自然的一个飞跃。抽象的数学语言从无到有的形成过程很漫长。文字产生之初就开始发明数字符号,数和直线等基础概念的形成经过了漫长的时间,数学作为一种基于公理知识的形式系统,不断地被人们用来解释现实世界的实体。人们只是想利用数学来解释、证明自然界的现象而已,数学思维对于认识宇宙发挥了极其重要的作用。数学产生结构和数据,抽象的数据在智能时代被比作“石油”,可以进行大数据挖掘,帮助寻求事物运行的规律。数学是基于想象和推理的,数学不是发现,而是发明。例如:无理数的发明是体现数学理论在解释自然规律和现象深刻性方面的一个典型例子,无理数是无限不循环小数,是不能通过测量得到的;点是没有大小的,线是没有宽度的,面是没有厚度的;数学能够研究、解释无限的世界,并可以利用无限研究有限,整数有无限个,实数也有无限个,这两个无限是有本质差别的。伟大的数学家戴维·希尔伯特说,“从未有其他的问题能如此深刻地触动人的心灵,没有其他的思想能如此富有成果地激发人的思维逻辑领悟力”[11]。在个人的认知世界里,思维常常远超出实际。如虚数是通过解方程x² 1=0产生的,后来才发现有广泛的应用;17世纪才被用于描述田奇的运动;黎曼几何是广义相对论的数学框架;纤维丛理论在规范场理论中发挥的作用;矩阵和无限维空间在描述量子力学中的重要意义;概率论在统计力学、生物和金融中的广泛应用等。

一切数学结果必须根据事先明确规定的公理用演绎法推出,伟大的数学家高斯曾说“数学是科学的皇后”,那么宇宙应该是数学的“皇帝”。把数学归属于自然科学并不确切,物理是研究现实存在的,是基于观察和实证的,没有数学,宇宙里的很多现象和规律就无法表达。物质和能量都是有量纲的,数学是不带有任何物理量纲的主观认知,关注的仅仅是量与形的规律。物理被写在宇宙这本“天书”里,它持续地打开在人类眼前,但在人类的认知空间里,在人类学会书写文字和符号之前,在发明数学之前,人类是无法读懂这本“天书”的。因此,数学是探索和认知物理空间的工具。人类在数学上的尝试使得人们开始理解宇宙。爱因斯坦说,“纯粹的数学构造使我们能够发现概念和联系这些概念的规律,这些概念和规律给了我们理解自然现象的钥匙”[12]。因此,数学受到高于其他一切学科的特殊尊重。但是,无论数学语言如何抽象,结构如何复杂,它也离不开人类自然语言的支撑。

1.3认知的螺旋

人类既是自然的成员,也是自然的观察者。一个人在物理空间中的具身行为和在认知空间中的思维活动,总是以“感知、思维、行为、再感知、再思维、再行为”的方式交互、循环、迭代,人脑进化形成瞬时记忆、工作记忆和长期记忆个不同的、分层级的区域[13]。感知是认知的源泉,利用各种感觉器官联合观察,在瞬时记忆区依据当前注意力,通过跨模态感知融合得到的信息,进一步在工作记忆区利用记忆智能和计算智能作出判断和决策,巩固或调整长期记忆区,通过具身行为与客观世界交互。行为是认知的目的和外化表现。感知和行为都发生在物理空间中,思维发生在认知空间中,感知、思维和行为随时间变化在物理空间和认知空间中不停循环。一个正确的认知往往需要经过由物理空间到认知空间、再到物理空间的多次迭代。每一次迭代得到的结果会作为下一次迭代的初始,不断地纠错、调整和提升不同形式的记忆区。认知的形式化需要分析以下几点:认知的开放性,尤其是交互性;认知的不确定性,尤其是不确定性中的基本确定性;认知的层次性,尤其是递归性;认知的主动性,尤其是注意力机制;认知的复杂性,尤其是涌现;认知的整体性,尤其是感知—思维—行为之间的协同性。

物理空间和认知空间的交互,激发了人类的想象力和创造力,激发了从感知到思维的再抽象。每一次感知到的可能仅仅是部分特征、不完整碎片和属性,如时空识别或者目标识别。而思维是对被认知事物整体进行领悟、顿悟的过程,是对已有的记忆概念进行联想、再理解、再调整,或者是对认知事件进行统一,形成整体记忆。因此,思维是感知的高阶,行为是思维的目的和外化,认知随时间变化不断螺旋提升。

人类是群居动物,人类智能始于语言,人工智能始于文字,语言和文字是人类思维共通共有的载体[14]。人在主观的、抽象的和内在的认知空间里通过语言、文字进行学习、思维、分享,试图以此解释外在的、客观的和实在的物理空间的奥秘,解决现实中的各种问题,形成群体共识,最终形成人类文明生态。只有通过思维实现认知和记忆的不断累积,人类或机器在认知空间里的知识和智能才能成长,越来越逼近真实,才能不断解释、解决物理空间的诸多现实问题以及从未出现过的新问题[15]。无论是个人、群体,还是人类或者智能机器,弄清认知的基本模式/范式非常重要,这是所有认知科学的工具和基础。

2认知形式化的4种基本模式

《实践论》中提到,“无论何人要认识什么事物,除了同那个事物接触,即生活于(实践于)那个事物的环境中,是没有法子解决的”。这就是感知、思维和行为的关系。其中还提及,“感觉到了的东西,我们不能立刻理解它,只有理解了的东西,才更深刻地感觉它”。这就是思维,是感知的高阶。去粗取精,去伪存真,由此及彼,由表及里,分层分类,形而上,形成认知物理空间的知识体系,更新记忆,实现认知映射,有人称之为知识图谱或认知地图。不论是认知、思维,还是智能,都是指学习的能力,以及解释、解决问题的能力。人工智能是人类智能的体外延伸[16]。本文从曾经的人工智能符号主义学派拓展“抽象”,从连接主义学派拓展“联想”,从行为主义学派拓展“交互”,研究认知的形式化,从而提出认知形式化存在以下4种基本的认知模式(认知范式),为构建可交互、会学习、自成长的新一代人工智能架构奠定基础。

2.1记忆驱动的经验模式

人类认知始于行为也终于行为,行为最原始的方法是不停地从形象上模仿和试错,在物理空间通过视听等感知手段主动观察(observe)待解决问题的表象,在认知空间进行思维活动,分析和判断(orient)当前情况,对多通道、跨模态的感知数据去除噪声,消解冲突,进行情境融合,聚焦问题态势,然后唤醒记忆,在大脑皮层搜索,执简驭繁,李德毅院士:人类的四种基本认知模式从早先的记忆中迅速匹配到应对方案,在物理空间中进行行动(act)验证,一次次反复实践,形成记忆或者巩固记忆。记忆是思维的结果,是在重复行为中加深的结果,具有统计意义。如果再遇到同样的问题,直接选择记忆中对的方案,按经验处理即可,通过经验生成的记忆具有对新对象的识别能力。先界定边界,后推理。把一部分经验解释清楚的认知先放到特定边界的记忆中去完成推理,如果不行,再根据外部任务环境的变化结合自己的认知去确定问题的新前提或者新边界。在一个新的记忆边界框架下再推理,如此循环,直到问题被正确解决。在这种记忆驱动的经验模式OOA(observe-orient-act)中,记忆智能发挥了十分重要的作用。小孩从牙牙学语就开始养成小样本记忆,如识别妈妈和周围人群。小样本记忆的核心是记忆边界形成的小世界。机器学习中的深度学习从人脸识别开始取得成功,依靠记忆驱动实现分类和归纳,记忆随着脑发育而迅速成长,形成越来越多的经验数据。这都表明记忆智能和生长的环境强相关。

2.1.1案例一:二十四节气

人类依据二十四节气开展农耕活动和养生活动,是记忆驱动的经验模式中的典型案例。我国古代劳动人民长期反复观察太阳周年运动,进行判断,搜索匹配记忆里有关二十四节气的季节规律,直接开展实践活动。早在春秋时代,便有“二分”(春分、秋分)和“二至”(夏至、冬至)个节气,到了战国末期,又增加了“四立”(立春、立夏、立秋、立冬),又经过100多年的逐步补充,到秦汉时期基本完备。用天气的寒暑(小暑、大暑、处暑、小寒、大寒)、水气的凝结(白露、寒露、霜降)、雨雪的多少(雨水、谷雨、小雪、大雪)和生物的发育(惊蛰、清明、小满、芒种)来反映某一天属于春夏秋冬的程度,形成二十四节气对应农耕活动和养生活动的群体记忆。人们观察当前的时间,判断离哪个节气最近,搜索匹配已有的经验,直接进行行动。如对于芹菜种植而言,立夏育苗,立秋定植,立冬收获。记忆驱动的二十四节气经验行为还有很多,如图1所示。

图1二十四节气的农耕活动和养生活动

2.1.2案例二:传统中医

传统中医的观察方法是“望、闻、问、切”。

望诊患者的神色、舌象;闻诊患者的咳嗽、呼吸、口气、体气;问诊身体的寒热、是否出汗、大小便的形态、饮食喜恶和劳倦;切诊包括脉诊(触摸脉象的变化),如脉的沉浮、虚实、迟数、滑涩、洪细等,还有按诊,如胸腹的软硬、皮肤的肿胀、手足的温凉等。通过全面的分析,判断疾病的病机,搜索匹配医家丰富的经验,特别是自己长期实践形成的案例记忆,高效快捷地开出合适的方剂或者针灸治疗方案,强调一人一策,一次一方,待一个疗程之后,再观察患者,再诊断、治疗。中医诊断是根据肌体整体状态不断调整治疗方案的OOA交互过程(图2)。

图2中医诊断的OOA交互过程

2.1.3案例三:深度学习识别人脸和语音

近10年,深度学习极大地推动了人工智能的革新[17]。深度学习算法依靠大数据驱动实现了机器视觉、语音识别等感知的智能。机器通过学习大规模数据样本来训练一个深度神经网络大模型架构中的结构参数和上亿级数量的连接权重。对于卷积神经网络、Transformer等各类深度学习模型(图3),如果算力足够大,由大量人工神经元和相互连接权重构成的深度神经网络具有逼近任意复杂函数的泛化能力。机器基于大量的示例可以自主学习完成感知识别,无须进行显式编程,通过尝试、犯错以及自我调整等操作,逐步减少感知误差,机器通过自主学习实现感知智能,开辟了机器学习的新纪元。这与高等生物视觉神经系统分层的观察、联想和识别十分类似,成功模拟了从人的视网膜到初级视觉皮层,再到视觉皮层,最后到颞下皮层的视觉神经系统的感知。

深度学习利用大量标记或无标记数据来学习,属于记忆驱动的经验模式。标记数据代表了人类的经验,作为机器先验的领域知识,实现了注意力选择和语义提取,替代长期记忆,形成解决实际问题中的记忆智能和记忆驱动。当前,基于自监督预训练的大规模深度学习模型已经成为新一代人工智能应用的基础设施,其可以对海量无标记数据进行记忆。整个模型代表了人类共同的经验,所有人员在使用阶段能够直接调用基础模型,不需要进行复杂逻辑推理,而是直接给出解决问题的方案。深度学习正是属于记忆驱动的经验认知模式。

图3各类深度学习模型

2.1.4案例四:人工驾驶

日常生活中,人工驾驶是记忆驱动经验模式中的一个明显案例。驾驶是一个“观察—判断—行动”的过程,熟练的司机拥有许多关于驾驶的记忆智能,大部分情况下是依据已有的经验直接驾驶车辆,很少进行精确推理或者计算。其并不拘泥于精确的数字,而仅是安全驾驶,其驾驶行为很自如,驾驶动作近乎本能。

人在一生成长过程中的许多智能和技能,都属于记忆驱动的经验模式。在人类的多元认知中,这种模式是最原始、最直觉、最基础的,也是最宝贵的,历久弥新。

2.2知识驱动的推理模式

人类的第一次认知革命是6000年前语言、文字和教育的发明,从而创造了文化和文明。摩尔根将文明定义为“这一时代以声音字母之使用以及文字记录之制作而开始”[18]。智能可以脱离人体以文字等形式独立存在,人工智能始于文字,随后发明了教育,教育浓缩重演了人类的文明,迅速实现了人类认知的二次扩张,使得人类知识和技能得以传承[19-20]。人类通过接受教育掌握群体积累的知识,从此人类认知有了知识驱动的推理模式,表现为“观察(observe)—判断(orient)—决策(decide)—行动(act)”的认知螺旋形式,简称为OODA。

标签: 李德毅院士人类的四种基本认知模式

卓越科技网 网站地图 免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052 版权所有:卓越科技网 沪ICP备2023023636号-5