查看: 6995|回复: 3

[人机交互] 人机交互与智能的起源、本质

146 主题	3 听众	1503 积分

助理设计师

Rank: 4

纳金币: 1794
精华: 4

电梯直达

楼主

发表于 2018-6-21 15:03:20 |只看该作者 |倒序浏览

鸣谢：北京邮电大学人机交互与认知工程实验室

摘要：本文分析了人机交互与智能的哲学起源及科学起源，梳理了古代四大文明关注的不同焦点，即人物、人神、人人、人与环境之间的关系，由此导出了人机交互与智能的本质，分析了现代人机交互与智能中的一些重要概念，探讨了人机交互与智能中的自主性问题，研究了人机交互和智能的瓶颈，并由此提出了深度态势感知的概念，最后对人机交互与智能的发展进行了总结和展望。

关键词：人机交互，人工智能，自主性，态势感知，深度态势感知

1.智能与交互的起源

霍金曾说过,在过去的20年里，人工智能一直专注于围绕建设智能体所产生的问题，即在特定的情境下，可以感知并行动的各种系统,在这种情况下，智能是一个与统计学,和经济学相关的理性概念。通俗地讲，这是一种做出好的决定计划和推论的能力。那么什么是交互与智能，我们将在下文中进行探讨。

人工智能或智能科学，其概念最早发源于哲学，早期有一批伟大的哲学家,一直在讨论什么是智能，什么是知识。迈克·波兰尼(MichaelPolanyi)，他曾在20世纪60年代写过一部著名的著作：《The Tacit Dimension》（《默会的维度》），提出“我们知道的越多，那么我们知道的越少”。同时他还认为我们知道的远比我们说出来的要很多（Wecan know more than we can tell）。波兰尼这句话里面,体现出了默会的知识、隐形的知识,在支配着我们不断的向显性的知识进行递进、进行演化。

第二个人是弗里德里希·哈耶克。弗里德里希·哈耶克在经济方面对世界的影响非常大，他曾拿过诺贝尔经济学奖。他一生当中，涉列了政治、社会、经济、文化、艺术、哲学和心理学，在认知科学方面，他有一本著作《The Sensory Order》（《感觉的秩序》）。在这本书中，他明确地提出了一个观点“Action more than design”即行为远比设计更重要，其大意即人的各种感觉,是通过行为来表征出来的，而不是故意设计出来的，后来的演化造成了设计出现。维基百科的创立人很推崇《The Sensory Order》这本书，认为是这本书，点醒了他创立了维基百科。

第三个是卡尔·波普尔，他是一个伟大的哲学家，提出了三个世界的观点，物理的、精神的、和人工的。他有一本非常经典的著作《科学发现的逻辑》，他提出科学不是证实是证伪，他认为科学是提出问题进行猜想，然后进行反驳，不断的试错，有科学的出现，而不是常规意义上的观察归纳，然后证实的实证机制。在归纳里面有很多的漏洞，因为归纳是不完全的归纳，波普尔就有针对性的对归纳进行了梳理。

人工智能的科学起源，通常认为人工智能的技术起源，是从1956年美国达特茅斯会议开始。但它的科学起源，可以最早追溯到曾任剑桥大学老师的查尔斯·巴贝奇，他是世界上做机械计算机的鼻祖，做了一台机械的计算机，计算Sin和Cos数值的大小，从此人类拉开了计算的帷幕。另一个是剑桥大学的伯特兰·罗素。罗素利用其哲学思想和他的数学基础，创立了一个很重要的哲学分支——分析哲学。分析哲学的至高点是维特根斯坦，2005年左右曾有一次世界哲学家投票，排名第一即是维特根斯坦。维特根斯坦的前半期写了一部重要的著作——《逻辑哲学论》。这部书里提出，语言是哲学的重要的工具，也是哲学的切入点。在此之前，哲学的发展有两个里程碑，第一个是关于世界本源的问题，即是物质的还是意识的，这个讨论了一千多年，后来笛卡尔开始研究用什么样的方法来认识世界是物质的还是意识的，提出二元论。在此之后，人们找了很多方法来研究哲学，但收效甚微，直到维特根斯坦，他改变了哲学的轨迹。他前半生研究关于语言的人工性，所谓人工性的语言就是标准化的语言，格式化的语言，是流程性的程序化的语言，而他的后半期主要否定了自己前半期的工作，开始研究生活化的语言，自然性的语言。认为真正的哲学是通过生活化的语言，来体现出哲学的深奥和哲学的意义。

2.历史中的智能与交互

在人类的文明的历史中，有过四大文明古国，在这四大文明古国里边最著名的，即古巴比伦和古埃及，这两个文明，几乎同时出现，它们是距今6000多年前，就已经有了国家、工具、文字出现，这两个文明直接导致了欧洲文明的起源。这两个文明主要是研究人和物之间的关系，例如水利、工具、一些制度、法律。这种人和物之间的关系，后来影响到了欧洲的一些地中海(希腊)文明，后来辐射到整个欧洲大陆，诞生了科学和技术，科学和技术的宗旨研究，就是人和物之间的关系。

除了这两个最早的文明以外，第三大文明就是古印度文明。古印度文明里面很重要的特质，就是研究人和神之间的关系。人神之间的关系，主要是人和抽象事物，不可掌控的一些事物之间的关系，在中东一带，诞生了世界所有最主要的宗教，像伊斯兰教、像基督教、印度教，佛教等等，都源于此，都是关于人和神之间关系的。

第四大文明是研究人和人之间关系，人和环境之间关系的一个重要的文明，即中华文明。目前世界上唯一一个保存的较完整、较好的文明，就是中华文明。中华文明体现的不是人和物，人和神之间的关系，是人和人之间如何融洽，人和环境之间如何和谐，天、地、人之间如何共生的问题。

在距今2500年以前，西方公认的科学之祖和哲学之祖，是泰勒斯，他和中国的老子、孔子差不多出现在同一时代，其思想体现在他的一句箴言里面即“water is best”（水是最好的）。水是一种物质，地球生物是海洋里诞生出来的，然后水又滋育的和哺育了人类，所以西方的科学和哲学一开始就和物质密切相关，而我们的老子对水也有阐述“上善若水”，孔子的“逝者如斯夫”，也是对水的一种感叹，但他们大多都拘泥于感性和伦理方面，所以东西方文明的差异从这几个代表性人物语言里边大家可见一斑。

从上文可见在岁月的发展的历史长河当中，人类四大文明分别聚焦于人物、人神、人人、人与环境，相互之间的关系，而科学和技术的发展，和人和物之间的关联密切相关，所以，现代科学技术起源于欧洲，是顺理成章的，也是可以理解的。但是，目前来看，随着社会和人类不断的进步，人和人之间、人和环境之间的关系，日益提到日程上来，所以，现在整个世界的焦点，逐渐从西方转移到了以人人、人与环境为主的东方视角来。

3.智能与交互的本质

人和物之间的关系，是西方一个重要的研究方向，机器是人造物，所以人机交互，也是起源于这个西方。人机交互的本质，是共在，即“Being together”。人把自己的优点，和机器的长处结合在一起，形成了一个交互的，互补性的联结，未来人工智能的发展方向，很可能是人机融合智能或人机混合智能，即把人的智慧和机器的智能结合在一起，形成一个更有力的，支撑性的发展趋势，这样不但研究人机交互的脖子以下的，即生理的问题，而且还会研究脖子以上的，即心理的或者大脑的问题。其实，人机交互或人机混合智能，都是不准确的词，最准确的词是人机环境交互系统，因为人和机器及物质，其交互是不完整的，是通过环境这个大系统，来进行沟通的，所以人机环境系统工程，可能是未来的，一个主要的研究方向。

那么，人工智能或智能的本质是什么？可以从人的成长经历或发展上看出一些端倪。一般来说胎儿在母亲腹中，就已经开始有了各种感觉，如听觉、嗅觉、味觉、触觉，已经开始和外部的环境及母亲腹中的内部环境进行交互，已经产生了一个，很简单的“我”的概念。然后，出生以后，因为视觉、听觉等感觉发育得不是很完善，更多的是用触觉来接触世界，了解他周围的一些事物，随着自主能力的产生，会试图摆脱大人的束缚，更愿意自己爬，自己走，不希望别人去扶。可以看到，这时候已经开始否定了，否定别人的帮助。据国内外最新的研究结果，小孩形成语言的时候，无论东方还是西方，除了被不断重复灌输的爸爸、妈妈这种词以外，自己先说出的，都是从第一个单词--动词“不”开始的，然后会发展到，说“没有”还有“别”这些词。“不”、“没有”、“别”这些词，就是孩子们成长的一个过程，在这个过程当中，就体现出人的智能，是从否定开始的，否定外部，否定自己，否定很多事物，来产生了某种智慧性的东西。需要注意，在人工智能里边，其否定机制，还远远没有产生，所以人工智能和人的智能，有很大的差异。

我们在研究过程中发现，人工智能的起点，第一个词是“是”，being”，即存在，客观的物质，这是西方的哲学的一个很重要的词，世界是物质的还是意识的，其中物质就是“being”。然后，关于人的智能和智慧，还存在着“Should”-应该。《三国演义》里面的“义”，就是“Should”，“应该”的意思，“仗义”的“义”也是“应该”的意思，“应该”这个词，在西方里边非常重要，在东方里边也很重视，这是东西方文明融合的一个交汇点。Should，翻译成哲学语言，就是意识的指向，即awareness、consciousness。另外还有want，人有want，即想干什么，而机器不会want，机器只会按照程序、指令进行操作，而人还有一个“能（can）”的问题，即能做还是不能做。机器没有这个问题，只是操作。

休谟在他的哲学体系里边，提出了很重要的“休谟之问”：“是”推不出“应该”，这句话的意思是从事实里推不出价值观。中国古代著名的一句话“天行健，君子必自强不息”是不成立的。天行健是一个事实，君子必自强不息，是一种价值观，二者不能划等号，这里面涉及到一个很重要的词--“change”，“变”，人会不断的“change”，而机器则不能，只会按部就班、因循守旧、刻舟求剑。我们认为这五个词是人工智能和人类智能很重要的差异。另外，人还有一个很重要的特质，即感知的恒常性，人在变化的外界环境当中通常能够保留对这个事物的本来面目的感知，例如某种颜色。在不同的背景下，会改变这种颜色的影响，但是人却会能够在这种变化当中，找到不变的那种感觉，而机器不然，机器它对外部变化的颜色，会有一个实时的反应，很难找到那种不变的东西。

8.png (556.96 KB, 下载次数: 1188)

9.png (699.56 KB, 下载次数: 1189)

10.png (1.55 MB, 下载次数: 1184)

11.png (439.04 KB, 下载次数: 1221)

12.png (2.14 MB, 下载次数: 1216)

13.png (1.32 MB, 下载次数: 1205)

人机交互, 智能, 起源

分享到: QQ好友和群 腾讯微博 腾讯朋友 微信

转播0 淘帖0 收藏0 支持0 反对0

相关帖子

使用道具举报

kuaidaoshou

146 主题	3 听众	1503 积分

助理设计师

Rank: 4

纳金币: 1794
精华: 4

沙发

发表于 2018-6-21 15:03:52 |只看该作者

4.现代人工智能与交互

任何新的事物都有其产生的源泉，人机融合智能也不例外，人机融合智能主要起源于人机交互和智能科学这两个领域，而这两个领域起源都与英国剑桥大学有着密切的关系：1940年夏，当德国轰炸机飞向伦敦之际，人机交互与智能科学的研究序幕就被徐徐拉开了…英国人为了抵御德国人的进攻，开始了雷达、飞机、密码破译方面的科技应用工作，当时在剑桥大学圣约翰学院建立了第一个研究人机交互问题的飞机座舱（即著名的Cambridge Cockpit）以解决飞行员们执行飞行任务时出现的一些错误和失误，另外剑桥国王学院的毕业生图灵领导了对德军“恩尼格玛”密电文的破译…事实上，早在19世纪，剑桥大学的查尔斯.巴贝奇和阿达.奥古斯塔（剑桥大学毕业生、诗人拜伦的女儿，世界第一位程序员）就开始合作机械计算机软硬件的研制，20世纪之后，数学家罗素、逻辑学家维特根斯坦（图灵的老师和朋友）都对智能科学的起源和发展做出了重大的贡献。

（剑桥最著名的老鹰酒吧是现代人机交互技术的发源地之一）

在现代的人工智能的发展，剑桥大学也起到了非常重要的作用，其中有三个代表性的人物，第一个就是阿兰·图灵，他提出了图灵测试和图灵机的思想，然后影响了整个世界人工智能发展的轨迹。第二个人就是著名的深度学习之父Geoffrey Hinton，他曾是剑桥大学心理系的本科生，后来到了加拿大，继续做关于人工神经网络的研究，并提出了深度学习的概念和方法，人工智能因此而得到了复兴和现在的繁荣。第三个是AlphaGo之父Demis Hassabis，他是剑桥大学计算机专业的本科毕业生，对推动人工智能的发展，也起到了非常重要的作用。

人机交互的研究始于二战时期，当时主要研究因为各种不合理的设计导致的飞机故障，开始主要应用在航空航天领域，后来逐渐扩展的社会经济的各方面。最近人机交互里面有一个比较热点的领域——态势感知（situation awareness，也叫情景意识）由曾任美国空军女首席科学家Mica R. Endsley提出。态势感知或情景意识的提出，对整个人机交互产生了巨大的影响。Endsley对态势感知的定义，是在一定的时间和空间内，对环境中的各组成成分，进行感知、理解，进而预测这些成分的随后变化状况。可以看出，在整个人类的发展过程当中，智能科学是一个涉及交叉学科，涉及心理学、计算机科学、神经科学、哲学、语言学等等，这些学科构成的一个完整的学科体系，可以总称为认知科学。

当前人机环境系统工程的发展迅猛，其定义为：人机环境系统工程，是研究在人、装备和环境系统之间，实现最优匹配的一个领域，涉及到信息的输入、处理、输出和控制，以及反馈，人机环境系统的整体设计，及其优化等方面的研究，研究的目的，是整个系统的高效、安全、健康、和谐、敏捷等。

当前在这一领域的研究中出现了很多分支，例如，人机交互、普适计算、情感计算等，并产生了很多相应的关键技术，如多模感知、上下文感知、情感智能、环境智能、认知智能、多模界面、感性界面，这些技术用来实现一个最基本的目标，即自然的人机交互。在自然的人机交互中非常重要的一点是数据。所有智能的产生与刺激和数据密切相关，所谓刺激，就是人感知到的外部的映射。所谓数据是机器接触到的外部的输入，通过这两个来产生相应的融合、理解，进而进行相应的反应和规划。

数据空间对计算机起着非常重要的作用，研究数据的多指向性（包括能指、所指）是当前人机领域的一个难点和瓶颈，同时数据的多指向性，是人机的难以有效融合的一个最重要的瓶颈，人可以理解一个数据的多指向，多含义，而机器不然，机器有规范，有规则，它只能从一个角度来看待这个数据。

当前人工智能的发展有三大主要标志：深蓝、沃森和Alpha系列，这三个系统都和数据有关，它们都是在处理过去的大量的数据、规则、规划。但是这三个最顶级的系统，都有一个很重要的问题，一个瓶颈问题，就是它只能“得形忘意”，而不能“得意忘形”。真正的人的智能需要临机决策、举一反三，而不是像计算机及当前弱人工智能按照套路去运算。人是算计，算计要比计算灵活的多，是一种可以横跨主客观参数的交互性泛计算。

5.智能与交互中的自主性问题

未来的人机交互及人工智能系统，有明确的发展方向，它包含四个方面：主动的推荐、自主的学习、自然的进化、自身的免疫。在这四个方面中自主性是非常重要的一个概念。

美军有一个深绿系统，其目的是借鉴深蓝系统的思想，将其映射到军事指挥和控制领域。它通过指挥员助手、水晶球和闪电战三个模块，整合出当前的和过去的战场态势，以及实时有效的指挥员辅助决策。这个系统里最重要的是自主性和主动推荐。自主和主动是人工智能或智能科学一个很重要的研究热点和难点。自主应该包括以下几方面：

第一，自主应具有记忆的功能，而不是存储，记忆是灵活的，能够通过相关无关的事物产生直觉，而存储则无法出现直觉，它只是符合逻辑的东西。

第二，自主应具有选择性。选择性是单向性的，即A选择B。

第三，自主应具有匹配性。匹配和选择最大的区别，就是匹配是双向性的，A可以选择B，B也可以选择A。

第四，自主应可以控制。没有控制和反馈，自主很难建立起来。

未来的人机交互及人工智能系统，它至少是人机环境系统的自主耦合，形成了一个认知智能环路系统。认知的意思就是信息的流动过程，包括输入、处理、输出和反馈这几个环节。

人工智能的重要发展方向，是人机混合智能。强人工智能、迁移人工智能、通用人工智能，及类人人工智能，实现还相对较遥远，当前相对实现的途径就是人机混合智能。人机混合智能就是研究如何在人、机及环境系统之间，实现最优的智能匹配，人的智能加上机器的智能，涉及人机环境系统的整体设计，及其优化等方面的研究，研究的目的包括可靠、高效和敏捷等几个方面。它最主要的涉及到两个基本问题，一个是人的意向性和机器的形式化问题。所谓意向性，就是意识的指向。机器难以处理涉及到灵活、可改变的，甚至带有矛盾悖论性的事物，但是机器的长处在于它不疲劳、存储大、擅计算，并且能够准确及时处理形式化、符号化的东西，而这是人所不擅长的。所以，如何把机器的长处和人的一些优点充分的结合在一起，这是一个很重要的命题，也是人机混合智能的一个瓶颈，其中两者之间何时/如何相互介入及介入的反应时、准确率是这个瓶颈中的关键问题。

在人工智能和机器人领域有一个著名的悖论叫莫拉维克悖论，莫拉维克悖论指出：和传统假设不同，对计算机而言，实现逻辑推理等人类高级智慧只需要相对很少的计算能力，而实现感知、运动等低等级智慧却需要巨大的计算资源。说明当前人工智能领域很多问题不是仅仅靠提高计算能力就能解决的，这个悖论用哈佛大学心理教授Steven pinker的一句话来说，就是困难的问题是简单的，简单的问题是困难的。

对于人工智能这个最终的悖论而言，意向性、意识是整个智能科学的瓶颈，可以看出，意识就是一种感知，这是情境感知。还有一种是非情境的感知，能够穿越时空，这是人的意识，机器则不然。

对于意识，著名心理学先驱，美国第一届的心理学协会的会长William James曾说过“人的智慧就是忽略的艺术”，人知道怎么忽略一些不重要的事物，而把精力聚焦到一些重要的，一些关键之处/特征之上，而机器不然，只擅长处理大数据，而不擅长处理小数据、假数据。

“自我”的产生是意识最重要的一个基础，自我的概念实际上就是建立了一个坐标系，“自我”即坐标系的原点，人类都是以自我为原点度量周围世界与事物的。意识的出现往往会造“无中生有”和“有中生无”。无中生有，往往是只有外界的刺激所产生的数据形成数值，数值不但包括客观的数量，而且还形成了主观的赋值。比如说“1”里边，它既是一个单纯的客观的数值，同时“1”也是对自我有特殊意义的一个数，例如一杯茶，一条毛巾，里面有很多主观的一些情感化的赋予。第二，形成数值以后，需要提取有价值的东西即信息。信息就是有价值的数值或者数据，从信息里面可以获取知识，从知识里边提炼逻辑，也就是从0到1，从1到n的过程，正应了中国古代道教所说的：道生一、一生二、二生三、三生万物，它整个的过程就是无中生有的过程。有中生无，就是指逻辑产生意向，从意向性导出意识，就是觉察觉知，从意识里边，沉淀出潜意识，从潜意识升华为无意识的过程，也就是从n到1，从1到0的一个过程，万物归三、三归二、二归一、一归道之历程。

6.深度态势感知

通过意识或态势感知（情景感知）及情境化的东西和非情境化的东西的结合，我们提出一个新的概念，叫做深度情境意识，或深度态势感知（Deep Situational awareness）。什么叫深度的态势感知，我们认为：这是一种人机智慧，既包括了人的智慧，也融合了机器的智能，是能指和所指，所谓能指,就是指事物本身。所谓所指就是事物本身所包含的语义和内涵，即涉及事物的属性。能指主要涉及到事物的感觉，又关联它们之间的关系,所指包括它们的知觉。所谓感觉,就是指对属性的这种映射，所谓知觉就是联系、理解。既能够理解事物原本之意，又能够明白弦外之音，是合情合理、通情达理的一个方式，是人机环境系统中各元素的主动的拓朴，处理跨情境的原型特征的一个空间。与Endsley态势感知概念的不同之处是，它关涉有限时空和数据/信息资源环境下的人、机、环境系统之间的交互，包含人的态势感知和机的态势感知及其之间的有机融合。

深度态势感知具体涉及的是感觉、知觉、规划和反馈那么四个环节，感觉，人的感觉和机器的这种输入有所区别，人的感觉里面包含了想象和真实的刺激，所以人的感觉是真实的和虚拟信息的叠加，知觉就是把这些信息串起来。所谓对事物的理解，就是看见了之间的各种联系。规划和反馈则是控制方面的两个重要术语。

另外，人的深度态势感知或深度情境感知中有一个很重要的机理——弥聚，就是能够把数理、地理、物理、生理、心理、伦理、法理、管理等方面的知识及时的准确的进行相应融合、分配、表征、延展，而机器只是从一个角度进行梳理，所以人机的差异在深度态势感知能力的弥聚效应。

人工智能发展到今天，它解决的主要的途径，就是形式化、符号化。当前人工智能在知识表示、问题的求解、自动的推理、机器学习、自然语言理解和模式识别方面进行了诸多工作，也进行了统一的认知结构化的处理。但当前人们对人工智能的未来，仍有很多的质疑和不满，主要原因在于有两个很重要的领域，尚未得到有效的开发，一个是神经科学，关于人类大脑的开发还没有得到非常突破性的成果。第二是认知心理学，这个领域也没有得到很好的发展。神经科学涉及到三个主要的方面，第一是神经的编码，第二是计算的回路，第三是神经的发育，这三个方面，都没有得到有效的这种研究和表征。认知心理学里中概念的发展，学习和记忆，和知觉的加工，也没有深刻的理解，所以，这种认知的滞后，进而映射到这个人工智能里面，产生了一些不良的反应，所以如何来实现这些学科的综合协调的发展，人机环境系统，很可能是进行协调和整理一个有效的工具。

在这个感性和理性的过程中，有一个很重要的方向，就是大家所熟知的可计算性理论。在可计算性理论里边有一个对立面——可算计性理论。所谓可计算性理论，就是指运用事先规定的规则，将一组数值，变换为另一组数值的过程，就是可计算的过程。而可算计性理论不但要处理合理性，还要处理非合理性，包括非理性的东西。它不但要处理逻辑性的东西，而且要非逻辑性的东西；不但要进行计算，而且还要进行算计，这些对立面的整合，可能是算计性理论的一个基础。在此基础上，需要对学习、理解、知识和概念进行重新定义。例如理解的概念是看见了联系叫理解，看不到联系叫不理解。对于人的学习，学和习不同，学是由内而外发出的主观性行为，习是练习，通过练习，来加强它的理解，而机器则不是学习，机器是输入，是赋值，是规则。

总结

本文中探讨了人机交互和人工智能的起源和瓶颈问题，人工智能和智能科学的发展，包括三个基本的阶段，第一个阶段是传统的人工智能，这个传统的人工智能已经有了游戏规则，它的基本的特质就是数学形式化的东西，加上再某一领域的展开。这里边还涉及到一个自动化的问题，其实很多问题是自动化的问题，不是人工智能的问题。自动化涉及的是结构化的数据处理，人工智能是非结构化的数据处理。第二个大的阶段是人机环境系统的交互领域，这个领域里边正在形成规则。这个规则主要体现在两个方面，第一个方面就是自动化的处理，第二个方面是弱人工智能。当前在这个领域里，还要加上各个行业和各个研究的指向。第三个领域就是未来人机融合智能系统领域，在这个领域里面，目前还没有游戏的规则，它主要的体现在人的智慧加上未来的强人工智能，或一些通用的人工智能。这个领域，还需要进行一些积极的探讨与多学科交叉研究。

使用道具举报