鸣谢:北京邮电大学人机交互与认知工程实验室
摘要:本文分析了人机交互与智能的哲学起源及科学起源,梳理了古代四大文明关注的不同焦点,即人物、人神、人人、人与环境之间的关系,由此导出了人机交互与智能的本质,分析了现代人机交互与智能中的一些重要概念,探讨了人机交互与智能中的自主性问题,研究了人机交互和智能的瓶颈,并由此提出了深度态势感知的概念,最后对人机交互与智能的发展进行了总结和展望。
关键词:人机交互,人工智能,自主性,态势感知,深度态势感知
1.智能与交互的起源
霍金曾说过,在过去的20年里,人工智能一直专注于围绕建设智能体所产生的问题,即在特定的情境下,可以感知并行动的各种系统,在这种情况下,智能是一个与统计学,和经济学相关的理性概念。通俗地讲,这是一种做出好的决定计划和推论的能力。那么什么是交互与智能,我们将在下文中进行探讨。
人工智能或智能科学,其概念最早发源于哲学,早期有一批伟大的哲学家,一直在讨论什么是智能,什么是知识。迈克·波兰尼(MichaelPolanyi),他曾在20世纪60年代写过一部著名的著作:《The Tacit Dimension》(《默会的维度》),提出“我们知道的越多,那么我们知道的越少”。同时他还认为我们知道的远比我们说出来的要很多(Wecan know more than we can tell)。波兰尼这句话里面,体现出了默会的知识、隐形的知识,在支配着我们不断的向显性的知识进行递进、进行演化。
第二个人是弗里德里希·哈耶克。弗里德里希·哈耶克在经济方面对世界的影响非常大,他曾拿过诺贝尔经济学奖。他一生当中,涉列了政治、社会、经济、文化、艺术、哲学和心理学,在认知科学方面,他有一本著作《The Sensory Order》(《感觉的秩序》)。在这本书中,他明确地提出了一个观点“Action more than design”即行为远比设计更重要,其大意即人的各种感觉,是通过行为来表征出来的,而不是故意设计出来的,后来的演化造成了设计出现。维基百科的创立人很推崇《The Sensory Order》这本书,认为是这本书,点醒了他创立了维基百科。
第三个是卡尔·波普尔,他是一个伟大的哲学家,提出了三个世界的观点,物理的、精神的、和人工的。他有一本非常经典的著作《科学发现的逻辑》,他提出科学不是证实是证伪,他认为科学是提出问题进行猜想,然后进行反驳,不断的试错,有科学的出现,而不是常规意义上的观察归纳,然后证实的实证机制。在归纳里面有很多的漏洞,因为归纳是不完全的归纳,波普尔就有针对性的对归纳进行了梳理。
人工智能的科学起源,通常认为人工智能的技术起源,是从1956年美国达特茅斯会议开始。但它的科学起源,可以最早追溯到曾任剑桥大学老师的查尔斯·巴贝奇,他是世界上做机械计算机的鼻祖,做了一台机械的计算机,计算Sin和Cos数值的大小,从此人类拉开了计算的帷幕。另一个是剑桥大学的伯特兰·罗素。罗素利用其哲学思想和他的数学基础,创立了一个很重要的哲学分支——分析哲学。分析哲学的至高点是维特根斯坦,2005年左右曾有一次世界哲学家投票,排名第一即是维特根斯坦。维特根斯坦的前半期写了一部重要的著作——《逻辑哲学论》。这部书里提出,语言是哲学的重要的工具,也是哲学的切入点。在此之前,哲学的发展有两个里程碑,第一个是关于世界本源的问题,即是物质的还是意识的,这个讨论了一千多年,后来笛卡尔开始研究用什么样的方法来认识世界是物质的还是意识的,提出二元论。在此之后,人们找了很多方法来研究哲学,但收效甚微,直到维特根斯坦,他改变了哲学的轨迹。他前半生研究关于语言的人工性,所谓人工性的语言就是标准化的语言,格式化的语言,是流程性的程序化的语言,而他的后半期主要否定了自己前半期的工作,开始研究生活化的语言,自然性的语言。认为真正的哲学是通过生活化的语言,来体现出哲学的深奥和哲学的意义。
2.历史中的智能与交互
在人类的文明的历史中,有过四大文明古国,在这四大文明古国里边最著名的,即古巴比伦和古埃及,这两个文明,几乎同时出现,它们是距今6000多年前,就已经有了国家、工具、文字出现,这两个文明直接导致了欧洲文明的起源。这两个文明主要是研究人和物之间的关系,例如水利、工具、一些制度、法律。这种人和物之间的关系,后来影响到了欧洲的一些地中海(希腊)文明,后来辐射到整个欧洲大陆,诞生了科学和技术,科学和技术的宗旨研究,就是人和物之间的关系。
除了这两个最早的文明以外,第三大文明就是古印度文明。古印度文明里面很重要的特质,就是研究人和神之间的关系。人神之间的关系,主要是人和抽象事物,不可掌控的一些事物之间的关系,在中东一带,诞生了世界所有最主要的宗教,像伊斯兰教、像基督教、印度教,佛教等等,都源于此,都是关于人和神之间关系的。
第四大文明是研究人和人之间关系,人和环境之间关系的一个重要的文明,即中华文明。目前世界上唯一一个保存的较完整、较好的文明,就是中华文明。中华文明体现的不是人和物,人和神之间的关系,是人和人之间如何融洽,人和环境之间如何和谐,天、地、人之间如何共生的问题。
在距今2500年以前,西方公认的科学之祖和哲学之祖,是泰勒斯,他和中国的老子、孔子差不多出现在同一时代,其思想体现在他的一句箴言里面即“water is best”(水是最好的)。水是一种物质,地球生物是海洋里诞生出来的,然后水又滋育的和哺育了人类,所以西方的科学和哲学一开始就和物质密切相关,而我们的老子对水也有阐述“上善若水”,孔子的“逝者如斯夫”,也是对水的一种感叹,但他们大多都拘泥于感性和伦理方面,所以东西方文明的差异从这几个代表性人物语言里边大家可见一斑。
从上文可见在岁月的发展的历史长河当中,人类四大文明分别聚焦于人物、人神、人人、人与环境,相互之间的关系,而科学和技术的发展,和人和物之间的关联密切相关,所以,现代科学技术起源于欧洲,是顺理成章的,也是可以理解的。但是,目前来看,随着社会和人类不断的进步,人和人之间、人和环境之间的关系,日益提到日程上来,所以,现在整个世界的焦点,逐渐从西方转移到了以人人、人与环境为主的东方视角来。
3.智能与交互的本质
人和物之间的关系,是西方一个重要的研究方向,机器是人造物,所以人机交互,也是起源于这个西方。人机交互的本质,是共在,即“Being together”。人把自己的优点,和机器的长处结合在一起,形成了一个交互的,互补性的联结,未来人工智能的发展方向,很可能是人机融合智能或人机混合智能,即把人的智慧和机器的智能结合在一起,形成一个更有力的,支撑性的发展趋势,这样不但研究人机交互的脖子以下的,即生理的问题,而且还会研究脖子以上的,即心理的或者大脑的问题。其实,人机交互或人机混合智能,都是不准确的词,最准确的词是人机环境交互系统,因为人和机器及物质,其交互是不完整的,是通过环境这个大系统,来进行沟通的,所以人机环境系统工程,可能是未来的,一个主要的研究方向。
那么,人工智能或智能的本质是什么?可以从人的成长经历或发展上看出一些端倪。一般来说胎儿在母亲腹中,就已经开始有了各种感觉,如听觉、嗅觉、味觉、触觉,已经开始和外部的环境及母亲腹中的内部环境进行交互,已经产生了一个,很简单的“我”的概念。然后,出生以后,因为视觉、听觉等感觉发育得不是很完善,更多的是用触觉来接触世界,了解他周围的一些事物,随着自主能力的产生,会试图摆脱大人的束缚,更愿意自己爬,自己走,不希望别人去扶。可以看到,这时候已经开始否定了,否定别人的帮助。据国内外最新的研究结果,小孩形成语言的时候,无论东方还是西方,除了被不断重复灌输的爸爸、妈妈这种词以外,自己先说出的,都是从第一个单词--动词“不”开始的,然后会发展到,说“没有”还有“别”这些词。“不”、“没有”、“别”这些词,就是孩子们成长的一个过程,在这个过程当中,就体现出人的智能,是从否定开始的,否定外部,否定自己,否定很多事物,来产生了某种智慧性的东西。需要注意,在人工智能里边,其否定机制,还远远没有产生,所以人工智能和人的智能,有很大的差异。
我们在研究过程中发现,人工智能的起点,第一个词是“是”,being”,即存在,客观的物质,这是西方的哲学的一个很重要的词,世界是物质的还是意识的,其中物质就是“being”。然后,关于人的智能和智慧,还存在着“Should”-应该。《三国演义》里面的“义”,就是“Should”,“应该”的意思,“仗义”的“义”也是“应该”的意思,“应该”这个词,在西方里边非常重要,在东方里边也很重视,这是东西方文明融合的一个交汇点。Should,翻译成哲学语言,就是意识的指向,即awareness、consciousness。另外还有want,人有want,即想干什么,而机器不会want,机器只会按照程序、指令进行操作,而人还有一个“能(can)”的问题,即能做还是不能做。机器没有这个问题,只是操作。
休谟在他的哲学体系里边,提出了很重要的“休谟之问”:“是”推不出“应该”,这句话的意思是从事实里推不出价值观。中国古代著名的一句话“天行健,君子必自强不息”是不成立的。天行健是一个事实,君子必自强不息,是一种价值观,二者不能划等号,这里面涉及到一个很重要的词--“change”,“变”,人会不断的“change”,而机器则不能,只会按部就班、因循守旧、刻舟求剑。我们认为这五个词是人工智能和人类智能很重要的差异。另外,人还有一个很重要的特质,即感知的恒常性,人在变化的外界环境当中通常能够保留对这个事物的本来面目的感知,例如某种颜色。在不同的背景下,会改变这种颜色的影响,但是人却会能够在这种变化当中,找到不变的那种感觉,而机器不然,机器它对外部变化的颜色,会有一个实时的反应,很难找到那种不变的东西。
|