morinson 发表于 2015-9-21 19:31:53

人工智能是否可以超越人类智能?

本帖最后由 morinson 于 2015-9-21 19:33 编辑

第21 卷,第5 期           科学技术与辩证法Vol. 21  No. 5
2004 年10 月          Science ,Technology and Dialectics           Oct . ,2004
人工智能是否可以超越人类智能?
———计算机和人脑、算法和思维的关系
钱铁云
(华中科技大学计算机学院,湖北武汉430074)
摘 要: 计算机硬件的发展使得在将来有一天完全可以造出在计算能力上和人类大脑一样快速的计算机,但是这是否意味着人工智能的发展终于将赶上并超过人类智能的发展呢? 本文认为答案是否定的,其原因在于作为计算表现形式的算法不可能实现思维。文章从计算的基本理论、数理逻辑及思维科学的角度出发,在以下两个方面论述了算法对比于思维的局限性:思维之非言语性、形式系统之不完全性,并在最后指出只有在逻辑思维领域的某些问题上计算机能够超过人类,但在总体上,计算机永远无法摆脱作为人类工具的命运。
关键词: 人工智能;人类智能;算法;思维
中图分类号: TP311    文献标识码:A    文章编号:1003 - 5680 (2004) 05 - 0044 - 04

  人类自身的智能是人类思维活动中表现出来的一种能力,大脑是人类认知和智能活动的载体,思维则是大脑对客观事物的本质及其内在联系的间接和概括的反映 。相对于人类智能,人工智能的定义是研究怎样制造计算机并为其编程,使其能做心灵所能做的那些事情。从这个定义看出:人工智能的目的是为了做心灵所能做的那些事情,而其实现途径是制造计算机并在计算机上编程。因此,计算机和程序是实现人工智能的两个必要条件,计算机是实现AI 的硬件基础,而程序则是AI 的软件方法。而所谓程序就是数据结构加算法,从这个角度出发,我们从计算机和算法的角度对AI 的能力进行考察是合理的。从人工智能和人类智能的比较中我们可以看到,计算机在人工智能中的作用正如大脑在人类智能中的作用,它们都提供了智能活动的物质基础,而算法之于人工智能则好比思维之于人类智能,两者都是智能活动的具体体现。如果将计算机和人脑、算法和思维对应起来,就可以获得关于人工智能和人类智能的比较。
一 计算机与大脑
1. 大脑的结构及工作原理
      人脑约有1011神经单元组成,每个神经元由细胞体及突起两部分构成,其中突起又分为树突和轴突,一个神经元的轴突末梢和另一个神经元的树突或细胞体间的联结称为突触。一个神经元约有103~104 个突触,人脑中共有1014个突触,神经细胞之间通过突触复杂地结合在一起。突触是神经元之间传递信息的结构,前一个神经元的轴突末梢称为突触的前膜,后一个神经元的树突称为突触的后膜,前后膜之间有一宽度约0. 02um 的突触间隙,突触间隙是生物神经元进行信息传递和存储的重要部位,也是电系统和化学系统的耦合部位。
      神经冲动的传递过程:当信息以电脉冲形式到达前膜时,就诱导释放神经化学递质分子,递质通过突触间隙和膜上的受体相结合,打开通向后膜的离子通道,从而导致后神经元产生动作电位。在这种传递过程中,约有0. 5 毫秒~几个毫秒的突触延迟,也可以称作神经元的动作速度。
      突触之间的连接具有如下特点: (1) 通过学习可以使相应的突触间的连接更多; (2) 信息通过突触的传递使得有关神经元的连接更加紧密,从而稳固了存储记忆,相反,若长久不用,则连接会慢慢减弱甚至消失。所以有大脑的第二进化一说,这同时也解释了为什么人脑不仅与先天遗传因素相关,也与后天的环境(经历、学习、训练) 有关。据此,我们可以反驳中提出的第一个“心智悖论”,文章提到即使同卵双胞的两个大脑基质完全相同的个体,也不可能有完全相同的心智活动,并以此来反驳心智作为大脑的软件系统。我们自然承认世界上没有两个人具有完全相同的心智活动,但是认为其原因在于世界上没有两个人具有完全相同的大脑,即使是同卵双胞的两个大脑,在它们开展真正意义上的心智活动之前,必然受到后天环境的影响,发展形成不同的大脑基质。因此我们认为心智应该被认作大脑的软件系统。
2. 计算机的结构形式及其工作方式
      目前通用的计算机的基本元件是半导体材料,其动作速度为1029秒,其系统结构仍然没有摆脱冯·诺依曼型的范畴,它由运算器、控制器、存储器和输入/ 输出设备组成。输入设备将数据和指令传送到存储器中,控制器负责在存储器中找出待执行的下一条指令进行译码然后根据译码的结果执行下列操作中的一种: ①在运算器中进行一种运算; ②将计算的结果存入存储器的某一适当的存储单元中; ③通过对某一寄存器内容的检查来确定下一条指令; ④向存储器输入一个字, ⑤向存储器输出一个字。
3. 计算机和大脑的区别
      从上面的比较可以看出,神经元的电位脉冲传递速度比半导体元件的电磁传播速度慢数百万倍,但是人却可以在几分之一秒的时间内对复杂的激励产生响应,而计算机却达不到,这是由于大脑是一个由巨量神经元连接形成的网络,计算是建立在大规模并行计算基础之上,这是传统计算机的串行处理方式所不可比拟的。为了在人工智能上有所突破,首先似乎应该寻求突破计算机在量级规模上的局限性以大幅提高计算机的计算速度。
      提高计算机速度的途径有两条,其一是提高电子器件的速度来提高计算机的性能,但由于受到光速及物理尺寸的限制,这条途径存在着极限,其二是通过计算机的体系结构方面的改进来提高计算机的性能,即在不同层次上引进并行处理技术,当今世界上最快的计算机都采用了高层并行技术。所谓并行处理,指的是利用多个具有计算能力的部件来共同完成一项计算工作,从而获得比单个部件要快的计算速度。随着计算机硬件技术的飞速发展(一方面单处理器的发展遵循摩尔定律,每18 个月其速度翻一番;另一方面并行计算机体系结构的不断改进,从Mesh、Butterfly、Hypercube 到如今的Cluster 结构) ,可以预见单纯就其计算速度而言,有朝一日计算机肯定可以达到大脑的运算速度。但是这是否意味着人工智能的发展能够达到人类智能的程度呢? 我们的答案是否定的。
      事实上,根据Church - Turing 论题:只要世界上有一台机器实现对部分函数f 的计算,则一定存在一台Turing 机,它能实现对部分函数f 的计算。该论题的另一个表述就是:从可计算性的角度,在世上所可能有的无穷多种计算机中,存在着功能最强的计算机种类,并且Turing 机就是一个具体的功能最强的计算机种类,只要硬件达到一定程度复杂性和灵活性的机器,都可以用图灵机来模拟,也就是说硬件其实完全不重要。在这种意义下,所有通用的电脑都是互相等效的,假设我们不关心运算的速度和存储空间的限制,则它们之间的差别可完全地被包容到软件中去 。电脑和人脑之间计算速度方面的差距同样不值一提,关键在于软件即算法和思维的区别。
      从目前计算机发展的规律也可以看出这一点,尽管目前高性能并行计算机已经发展到每秒钟100 万亿次浮点运算的速度,可是并行处理技术仍然处于相当落后的境地,远未跟上应用的需求。并行处理技术实用化的关键是并行软件技术即并行程序设计方法学,而并行程序设计方法学的核心内容是并行划分和算法映射。在算法映射中不仅要考虑进程到处理机的静态映象,由于数据在局部存储器上的非均匀性,还需要考虑进程调度问题,而进程调度问题是已经被证明是NP 难度的。可以看出,程序设计方法学上的不足是制约并行计算技术发展的瓶颈,并行程序设计的首要问题就是并行算法结构,也就是说,是并行算法制约着并行计算技术发展的瓶颈。
二 算法与思维
1. 计算的数学模型- Turing 机
      在上文我们尽管已经用到了Church - Turing 论题,但我们尚未给出Turing 机的确切定义。Turing 机是由一条无限长的纸带,一个读写头组成,机器有有限个内部状态集{q1 ,q2⋯⋯qm}和有穷字母表{s1 ,s2 ⋯⋯sn} ,初始时纸带的有穷个方格上分别被写上字母表上的某个符号,称为输入,其它方格均为空白,读写头处于输入的前一个位置, Turing 机往后的行为动作由有穷条规则构成的集合所指挥。Turing 机的行为规则(每一规则必须是严格地按数学家说清楚了的) 为三种形式的四元组: ①qisjskq1将带上符号由sj 改写为sk ,并且内部状态由qi 转为ql ; ② qisjLql将读写头左移一格,并且内部状态由qi 转为ql ; ③qisjRql将读写头右移一格,并且内部状态由qi 转为ql 。
      为了使Turing 机在任一时刻都确切地知道如何动作,规定行为规则集中任意两个四元组开头的两个字母不能相同,此条件称为Turing 机的协调条件。
2. 形式系统的一般结构和形式化
形式系统的一般结构由四个部分组成 :
①系统符号———规定系统允许使用的符号;
②形成规则———规定符号连接成合法序列的规则;
③初始公式———即公理,是无须证明的合法序列;
④推理规则———说明对系统中的合法序列可以进行一些什么样的处理,以使一个合法序列演变为另一个合法序列。
      形式化指的是建立一个形式系统的过程。在逻辑中,形式化是指 :使用专门的人工符号语言,按照严格的方式建立一个演绎系统。“严格”在这里的含义是指: ①除初始概念以外,任何概念必须由初始概念或已经定义的概念来定义;②除初始命题即公理外,任何断言必须是经过证明的,不许引进初始命题以外的假定作为证明的根据。
3. 算法的定义
      正如上文所指出的,计算的硬件基础是冯·诺依曼结构的计算机,计算的数学模型则是图灵机。算法是一组有穷的操作规则,它具有以下特征:
确定性:每一个步骤的结果都是确定的
可行性:每一个步骤可在有限时间内完成
输入:有输入
输出:有输出
有穷性:可在有限步骤内停止。
      由上述定义可以看出,算法是规则集合上的序列,而按照Turing 机的定义,规则是定义在有限符号集合上的有限符号序列的形式变换,所以算法必然也是基于某个形式系统的,只不过有些是显式的有些是隐式的。
4. 思维的分类
      从思维科学的角度来看,人类的思维方式,可以分为社会思维、抽象思维(逻辑思维) 和形象思维(直觉) 、灵感(顿悟) 等多种方式 。其中抽象思维的研究比较成熟,并由此发展出逻辑学。逻辑学中的数理逻辑是把数学上的形式化方法用到逻辑学上的结果,是用数学方法去研究演绎方法的科学,它已经成为计算机科学的基础。但是对社会思维、形象思维(直觉) 、灵感(顿悟) 等还缺少系统的研究。其中形象思维是一种具有普通性的思维形式,抽象思维是在形象思维的基础上发展起来的,灵感也和形象思维具有一定的联系。特别地,形象思维与图象处理、模式识别、语言、美感等问题都与形象思维相关。
三 思维之非言语性
      对思维之非言语性(例如形象思维的“不可言传性”) ,在历史上曾经有过不同意见。从图灵(Alan Turing) 的“人的大脑应当被看作是一台离散态机器”到纽厄尔(A. Newell) 和西蒙(H. A. Simon) 的“一个物理符号系统具有对一般智能行为而言的必要和充分的手段”,他们都把心灵的本质看作是计算,把思维看作是一种信息加工过程。
      事实上,思维非言语性的本质可以由德布雷斯的两个问题所概括:人在“信息加工”中是否真的象计算机那样遵循形式化规则;人类行为,无论是如何形成的,能否描述为一种可由数字计算机实现的形式化系统。对于德布雷斯的第二个问题, Sloman 已经于1986 年指出 :行为,无论在表面上给人以何等深刻的印象,仍是来自某个庞大的事先存储的查询表,而不同于结构式的过程和表象,因此行为不能看作是智能的。既然如此,行为能否描述为形式化系统已经跟我们的议题没有关联,据此,我们甚至可以抛弃图灵测试作为智能判别的标准,因为就其本质而言,图灵的立场是行为主义的,不仅如此,机器艺术,机器说的话、机器作的诗等都不能作为智能判别标准,因为机器的行为不能代表机器已经能够理解。
      让我们回到德布雷斯的第一个问题,该问题涉及到了一个基本问题即人类智能是否可以全部形式化? 由于形式化的过程必须使用人工定义的符号语言,则这个问题也可以解读为“思维可以全部用言语来表达吗?”。在本文第二部分对思维的分类中我们已经提到形象思维在思维中占有很重要的位置,但恰恰是对形象思维的研究表明,抽象思维靠语言,形象思维不靠语言,形象的感知是只可意会,不可言传的,对幼儿心理学的研究也表明,形象思维先于语言,先于抽象思维 。
      思维的非言语性已经有许多很好的例证,许多著名的科学家都曾经在将他们的思想翻译成语言时遭遇到困难,其原因就是找不到言语来表达需要的概念。爱因斯坦就曾经在一封信中写到“词语和语言,无论是写的或是说的,在我的思维机制中都不起任何作用。似乎作为思维要素的精神实体是一些能够“自动”复制与结合的特定符号和一些大致还算清晰的图象⋯⋯只有在第二阶段的联想活动充分建立起来并能随意复制时,才需费心寻找习惯的词语或其它符号”。
      罗杰. 彭罗斯所得到的结论是:一旦接受大多有意识思维确实具有非言语的特征- 依我看来,基于前面一些理由这个结论是不可避免的- 那么也许读者不难相信意识思维也具有非算法的成分 。
四 形式系统的不完全性
1. 程序设计在本质上是一种形式逻辑活动。
      哥德尔1930 年发表的“逻辑谓词演算公理的完备性”中,证明了谓词演算的完备性,由此,人类思维中采用的演绎推理规律,都可以用数理逻辑所采用的现代数学方法来刻划,而计算机科学是在数理逻辑的基础上发展起来的。A. R.Hoare 曾经指出 :计算机是数学机器程序设计是一种数学活动。从形式化、抽象化、问题定义、问题求解及证明验算等各个方面来看,程序设计与数学活动类似,本质上是一种形式逻辑活动。因此,计算机在解决问题的时候实际上都是基于某个形式系统,从而必然要服从形式系统的种种限制。
2. 形式系统的不完全性
      为了说明形式系统所具有的特点,让我们引进如下定义 :
·形式系统的一致性:在形式系统中,若不存在任一公式A ,使得A 和非A 都是系统中的定理,则这样的形式系统是一致的。系统的一致性也称做无矛盾性。
·形式系统的完全性:若对满足一定限制的任一公式A ,或者A 是系统中的定理,或者非A 是系统中的定理,则这样的形式系统是完全的。
·形式系统的可靠性:如果在一个形式的推理系统中,凡推理得到的定理,都是逻辑上为真的命题,则这样的形式系统是可靠的。
·形式系统的完备性:如果逻辑上为真的命题,都能在一个形式推理系统中作为定理导出,则这样的形式系统是完备的。
      1931 年,哥德尔发表“论数学原理和有关系统I 的形式不可判断命题”,该文中给出了著名的不完全性定理:任何包含初等数论的一致的形式系统都是不完全的,亦即在包含初等数论的一致的形式系统中,存在一个命题A ,该命题和其否定命题都是不可证的。由此可以推得哥德尔第一定理“在适当大的形式系统中,存在不可判定问题”和哥德尔第二定理“一个包含初等数论的形式系统的一致性,在系统内是不可证明的”。这两个定理的意义在于它揭露了形式系统中存在的致命缺陷,即它在描述能力上的局限性。它们毁掉了形式主义者找出完全形式系统及有穷主义一致性证明的期望,也毁掉了逻辑主义者找出一套清澈而广博的“大逻辑”形式系统的期望 。事实上,哥德尔定理制服了希尔伯特学派提出的大多数问题,驳倒了希尔伯特学派曾经期望的“科学数学化”规划,即将宇宙间事物的规律可以用数学形式表示出来,而数学的一切分支又可以归结为形式系统中的计算。至此,形式系统的不完全性已经一览无遗。
2. 算法到思维的差距
      算法到思维的差距可以概括为两个方面:一方面, 计算机是基于数理逻辑系统的,但是必须注意,数理逻辑刻划的只是人类思维中的抽象(逻辑) 思维规律,上文已经指出人类思维绝不仅仅限于抽象思维,还包括社会思维、形象思维、灵感思维等,而这些思维方式是不能全部形式化的,亦即思维之非言语性制约了算法只能解决非常有限的部分问题。另一方面, 形式化的思想体系没有超越抽象集合概念的范围,也没有超出对思维过程所做的纯集合性解释的范围。形式系统存在的不完全性又制约了形式系统反映事物规律的能力。这两个方面结合起来就形成了算法和思维之间不可逾越的鸿沟。
五 计算机和难解问题
1. 不可判定问题
      哥德尔第一定理指出形式系统中存在不可判定命题,这揭露出一个惊人的事实:在给定的系统,就能找到不可判定命题。因此在图灵机所模拟的计算系统中,也必然存在着不可判定命题。事实上图灵在哥德尔的著作后就确定了停机问题的不可解性,此后还发现了诸如有限群的字问题、Diphantus 方程解的存在问题以及铺砖问题等都属于不可判定问题。这些问题的存在说明了形式计算系统的局限性,即使在可形式化部分,也仍然存在图灵机(计算机) 不可计算的问题。
2. 非确定型难解问题
      在对Turing 机计算能力的描述上,我们在强调它与世上任何一台机器在多项式时间计算上的等价性的同时,完全忽视了速度或效率问题。尽管理论上任何一台机器能做的事情,Turing 机也能完成,但是速度的差异是存在的,与理论可计算的相对照的是实际上可计算的,空间和时间的消耗使得组合爆炸问题事实上不可计算,理论上亿万万年可算的问题在实际中决不能被“认为”是可算的。类似于3SAT 问题、3维匹配问题、顶点覆盖问题、Hamilton 回路问题、划分问题等被称作是NP 难度的,其含义是指对可判定的问题用一台非确定型的图灵机,可以在多项式时间算法求解。所谓非确定型的图灵机,是指在以上定义的图灵机中去掉协调性条件得到的机器,即它在任意时刻并不知道下一步的行为确定要执行什么指令。这样一来,我们只能通过“猜”的办法来从全部计算路径中选择一条进行计算,然后用多项式时间来验证该路径是否正确。
3. 非确定型难解问题上计算机的作用
      NP 问题的难解性在于其搜索空间太大,计算机存在组合爆炸问题,而对我们人类存在计算能力的局限,因此在NP问题的求解上,如果结合人类的智能和计算机的规模搜索的能力,特别是借助人类在分析与待解问题相关的特定信息中所得到的启发式策略来确定搜索的方向(这种启发式策略来自于人类社会的经验和法则以及大自然的运行规律) ,可以获得较为满意的结果,在1997 年的“人机大战”中“深蓝”战胜世界冠军卡斯帕罗夫就是一个明证。“深蓝”的胜利结合了人类象棋专家的智慧和“深蓝”的强大搜索能力(卡斯帕罗夫每秒钟只能往前看3 步棋,“深蓝”则可以每秒钟往前看2亿步棋) ,而且计算机具有不知疲倦、不受干扰、永不出错、永不遗忘等能力。关于计算机的作用,著名逻辑学家、计算机理论家和哲学家王浩曾经一针见血地指出:就理论上来说,计算机能做的事人也都能做⋯⋯首先,计算机在节省令人厌倦的脑力劳动方面肯定是有帮助的。其次,它们实际上使得我们能够计算繁复的计算,而不用它们是做不到这一点的。还有,当我们必须在限定的时间(特别是实际时间内) 完成某项任务(例如天气预报和经济决策) 时,计算机的速度是关键的 。
六 结论
      通过以上层层递进式的探讨,我们详细分析了计算机硬件和人脑、计算机软件(算法) 和思维之间的关系,计算机硬件可以达到人类大脑的计算能力,而算法作为一种演绎推理能力的反映,是不可能达到人类形象思维、灵感思维的能力的。计算机作为一种形式系统,具有不完全性,这又为计算机的能力设置了一个不可超越的界限。即使在可计算的部分,由于受到资源的限制,对于组合问题仍然不可解。只有在需要通过演绎思维能解决的问题上,如果该问题被恰当地描述为计算机所能接受的形式,则计算机可以代替甚至超过人类,但是由于前面两个方面的限制,计算机永远不能摆脱作为人类工具的命运,人工智能也永远不能超越人类智能。
【参 考 文 献】
靳藩. 神经计算智能基础 . 成都:西南交通大学出版社,2000. 91.
蔡曙山. 心智科学的若干重要理论探析 . 自然辩证法通讯. 2002 (6) :5.
罗杰,彭罗斯. 皇帝的新脑 . 许明贤,吴忠超译. 长沙:湖南科学技术出版社,1999. 25.
[ 11 ] 俞瑞钊. 数理逻辑[ M] . 杭州: 浙江大学出版社,1990. 1 、7.
刘西瑞,王汉琦. 人工智能中的形式化问题 . 自然辩证法研究. 2002 (8) :39.
孟凯韬. 思维数学引论 . 北京:科学出版社,1991. 7.
A. Sloman. What Sorts of Machines Can Understand theSymbol They Use ? Proc. Aristotelian Soc. Supp. 60 : 61~80.
钱学森. 关于思维科学[ M] . 上海: 上海人民出版社,1986. 451.
A. R. Hoare. Lecture Notes in Computer Science [ M ] .Berlin :Springer - Verlag ,1985. 206.
王浩. 哥德尔 . 康宏逵译. 上海:上海译文出版社,1997. 391.
王浩. 数理逻辑通俗讲话 . 北京:科学出版社,1981.26.
(责任编辑 殷 杰)

页: [1]
查看完整版本: 人工智能是否可以超越人类智能?