本文来自合作媒体:仝人 具身性智能(ID:embodied-AI),作者:吴易明、梁晶,作者单位:西安中科光电精密工程有限公司。猎云网经授权发布。
在过去的十余年中,基于深度学习的应用、大数据集的创建以及计算机算力的提升,人工智能技术在语音识别、人脸识别、围棋、机器翻译、目标检测、语义分割等任务中取得了重大进展,在很多单项能力方面甚至超越了人类。
深度学习神经网络的效用依赖针对不同的任务收集的海量数据集、网络架构,以及专家的训练,在特定领域、特定规则的限制下发挥作用,本质上是运用大数据解决某些不确定性问题,这种方法也类比于逻辑学领域的归纳论证法。
但从深度学习效果上来说,它与归纳法有很明显的不同。归纳法运用于科学研究,是基于个体现象经验的观察,以总结发现普遍的规律。这种规律能够有效的表述和表征时,可以反过来指导实践。
但深度学习神经网络训练后形成的网络参数非常多,其分布难以发现明显的规律,特别是难以用简洁的函数表征的规律,因此对其过程和结果难以有效解释。2012年以来其发展兴衰表明,在智能科学进阶发展的道路上,这一方法已经难以有效发挥作用。
按照一般共识,人工智能是研究机器复现智能的学科,这个概念是清晰且得到绝大多数科学家认可的。问题的关键在于:科学家(包括哲学家、数学家、脑与认知科学家、心理学家、人工智能专家)尚未真正完成对“智能”这个概念的阐释,更加令人困扰的问题是,阐释这一概念本身依赖人类的智能。
我们需要回到最基础的层面上,讨论到底什么是“智能”?
在当代智能科学的研究中,源自不同的科学基础或基本出发点,关于智能的概念一直存在不同的观点。
古典理论认为智能是一种纯粹的抽象符号处理过程,重要的是算法或者程序,古典理论认为抽象的功能是独立于特定的硬件之外的,即思想占据着主导地位。[1]
符号源于物理世界的抽象,符号运算依赖生物体的大脑和感官,或者构成机器的物理器件。古典理论或许与神创世界的宗教信仰是一脉相承的,也符合人类进化和个人成长的规律。
实际上,“智能”进化到一定程度,才有意识和能力概念化区分外界不同的实在,区分自身和环境,区分“意识”和实体。语言在这一过程中扮演了关键性决策,古典理论对符号的重视,本质上是“语言崇拜”。
古典理论毕竟推动了“智能”这一问题的研究,但因为客观条件和历史局限,它忽略了符号发源于生物智能体的身体和大脑这一事实,没有考虑身体是如何与真实世界相互作用的。
《不列颠百科全书》对智能的解释:“一种心理品质,它体现了一个人通过经验学习的能力,对新环境适应的能力,理解和运用抽象概念的能力。”
《现代汉语词典》中对智能的定义是:“指人认识、理解客观事物并运用知识、经验等解决问题的能力,包括记忆、观察、想象、思考判断等。”皮亚杰、加德纳等著名心理学家均持这一论点。
Linda Gottfredson教授在Why G Matters: The Complexity of Everyday(1997)一书中与其余52位学者把智能定义为“一种宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。”[2]
以上观点认为智能是人的专有特征,认为智能是一种心智能力,带有专指性,从外在功能表现上来界定智能的标准。
Ray Kurzweil(雷·库兹韦尔)提出,“智能就是最优地利用有限资源,包括时间,来达成目标的能力。(Intelligence is the ability to use optimally limited resources including time to achieve goals.)”[3]
John McCarthy指出“智能是在世界中实现目标能力的计算部分。人类、许多动物和一些机器具有不同种类和程度的智能。(Intelligence is the computational part of the ability to achieve goals in the world. Varying kinds and degrees of intelligence occur in people, many animals and some machines)”[4]
Ray Kurzweil的定义是递归式的最优求解;John McCarthy的定义落脚点在于计算。二者是类似的,均认为智能的本质是计算,具有逻辑实证主义(将认识看作以逻辑为基础的符号推理过程或计算活动)的风格。
迈克斯·泰格马克(Max Tegmark)在2017年极具影响力的著作《生命3.0:人工智能时代,人类的进化与重生》一书中将智能定义为“完成复杂目标的能力,而且此类能力不能只通过智商来衡量,而需要通过涉及所有目标的能力范围来衡量。”[5]
该定义方式将智能与完成复杂目标结合起来,但是“复杂”概念该如何界定?
由“走向智能丛书”的创始策划编委胡虎、赵敏、宁振波等九位专家合作撰写的《三体智能革命》一书指出:“智能本质是一切生命系统对自然规律的感应、认知与运用(能力)。”《三体智能革命》提出:“状态感知、实时分析、自主决策、精准执行、学习提升”五大特征是判断智能系统的基本判据。[6]
该定义认为智能行为应成闭环,这是对维纳控制论观点的继承和发展,但该定义中智能的主体限定为生命体。
《麻省理工学院认知科学百科全书》对智能的定义是:智能可以定义为适应、影响(改变)和选择环境的能力。
2018年,工信部原副部长、北京大学教授杨学山著在其所撰写的《智能原理》一书中指出:“智能是主体适应、改变、选择环境的各种行为能力。”该定义中对智能行为的描述,沿袭了麻省理工学院《认知科学百科全书》的定义,并有所调整。该定义包含了各类主体的各类行为,可以覆盖不同场景或语境下的智能。[7]
以上定义侧重于从认知科学的角度理解智能,包容了各类主体,强调了智能可以根据环境感知做出主动反应,具有一定的借鉴意义,但该定义对智能行为的目的采用了隐含的方式。
智能源于生命,在本源意义上,是高等的生物体(人)发展到一定阶段才能作为一个概念提出来的问题。显然,智能概念的讨论不能脱离生命和身体,我们追溯认知心理学的历史,认为从“具身性”出发,是认识“智能”的恰当的途径。
认知心理学表明,人的认知是基于身体的,也是根植于环境“建构”的。具身认知理论认为,认知和智力活动不是大脑的孤立的计算,而是大脑、身体(通过感觉器官)和环境的自适应交互迭代作用的产物。
具身认知肯定了认知主体的身体对认知活动的意义,重视认知活动发生时认知主体所处的环境对其认知的形成与改变所具有的重要影响。认知主体通过主动过程探索认知对象,形成有效认知。
身体的物质性过程、身体与外部环境的互动,既构成了认知系统的有机组成部分,也限制着行为的可能性,对作为认知主体信息处理中枢——“脑”进化带来直接影响。
具身认知理论强调主体能动、交互循环、通道对认知的塑造和制约等作用,对于“智能”的研究具有决定意义的启发式的贡献。
由此,我们认为:智能是“主体”的一种外显特性,在主体与环境的交互作用中显现,【智能可简单表述为问题求解和响应的能力】。
问题:定义中的问题包括:是什么(识别)?做什么(选择)?如何做(规划)?怎么样(评测)?
求解:基于已知信息(现象、模式和规律、约束)获取问题的答案。
响应:对问题结果进行呈现,呈现方式依赖主体机能和通道条件,表现为信息(形式占优)或者行动。
主体基于先天能力及经验归纳,认识规律、把握规律、运用规律、修正规律,实现对“现象”的信息获取和信息内涵把握,必要时通过主动干预或主客体交互,把握和改变问题结果。主体智能的增长,是以信息获取(感)、把握(知)为基础,以推演预测智能主体内外演变为方法,以做出有效响应或呈现为评判标准。
以“具身认知”为指导,由主体与环境、主体间相互作用及主体状态感知衍生出问题,智能系统能够基于问题(目标)自主生成过程方法,方法可能是合理的,也可能是错误的。也就是说,不以方法是否正确和复杂作为界定智能的唯一标准。
生物主体基于问题求解而反作用于环境的基本循环是生存问题求解循环,这个基本循环是高层次智能发生的必要基础。人工智能主体关注机器模仿人类的智能,不是以智能主体的生存为基础条件的,是以人工智能主体完成人类赋予的任务为驱动的,这一点会影响智能科学研究演进的道路。
我们认为,主体具备智能的关键在于:
主体能够基于自身的内在构造与知识(含记忆)对物理实存进行镜像映射,主体是基于重构映射的内容的交互作用来决策和行动的;
主体能够设定问题解决的基准,并进行比对检视,智能系统的问题求解过程是基于评测结果的循环修正。“基准”是在主体涌现概念并强化概念内涵过程中形成的,在进化迭代过程中,基准一般表现为从连续到离散化的演变。
调制:主体的主动作为(主要表现为局部或整体的运动、信息输出)等价于问题求解过程引入已知调制信息。调制发挥作用的基础是视觉空间(外在表现)与惯性空间(内蕴特征)之间的等价性。
从纷繁的现象和多学科、多维度研究中抽象出精准的表述来定义智能是困难的。“智能”概念作为一个“问题”被阐明,本质是理清楚“哪些对象的什么行为、过程的现象”可以被界定为智能的,这些现象可抽取什么共性内涵特征。
智能概念清理“这一问题求解过程”,也需要用来检视“智能”这个概念,要满足自指“自洽性”,概念阐明所需的语言工具需要直面这一挑战。回顾上一小节的论述,在这个方面,我们的认知和理论是满足的。
具身智能是智能科学进阶发展的新范式:智能机器人技术的发展,应以生物(包括人)智能发生及进阶中所呈现的具身性这一特点为指导,以有效复现和理解智能主体活动所涉及的智能器官/对象/环境的交互作用为路径,该路径有望开启机器智能的新阶段。
[1] Rolf Pfeifer,Josh Bongard.Body著.俞文伟等译.身体的智能.科学出版社.2009
[2] Linda S. Gottfredson. Why g matters: The complexity of everyday life.1997
[3] Ray Kurzweil. The Age of Spiritual Machines: When Computers Exceed Human Intelligence. DOI:10.1145/572277.572284, 2000
[4] McCarthy.“WHAT IS ARTIFICIAL INTELLIGENCE?”. Revised Nov. 12. 2007.
[5](美)迈克斯•泰格马克(Max Tegmark)著,汪婕舒译.生命3.0.浙江教育出版社.2018
[6]胡虎,赵敏,宁振波等著.三体智能革命.机械工业出版社.2016
[7]杨学山.智能原理.电子工业出版社.2018