-
摘要: 讨论了语言的三指功能(指名、指物、指心)与图灵测试的关系,指出早期的人工智能研究一般假设语言三指等价,因此致力于实现其中之一的功能.如果一个功能实现了,其他两个功能也就实现了, 比如图灵测试将智能的表现限定在指名功能里.但是,现代科学已经证明,语言三指不一定等价.这给人工智能的研究带来很大挑战,本文罗列了一些开放性问题,如对话的理论计算机制等.Abstract: This paper discusses relation between three language functions (denotation, connotation, annotation) and Turing test, and points out that it is usually assumed that three language functions (denotation, connotation, annotation) are equivalent in early stage of AI research. Under such assumption, many efforts are devoted to implementing one of three language functions and suppose that one becoming true results in two others. For example, intelligence can be fully implemented through annotation function of language in Turing test. However, it has been proved that three language functions (denotation, connotation, annotation) are not equivalent, which bring great challenges to AI research. In this paper, we list some open problems in AI research, such as computational theory of dialogue.
-
Key words:
- Language /
- Turing test /
- word /
- dialogue
-
自古以来,什么是智能就难以定义.1950年,图灵提出图灵测试[1],以是否通过人机对话测试来判定机器是否具有智能.图灵测试巧妙地避开了智能的内涵式定义和判定难题,将研究智能的重点放在智能的外在功能性表现,使得智能从工程上看是可以实现和判断的.现代人工智能从此肇始.
为了通过图灵测试,需要研究语言.而人类语言的功能大致有三个: 指向客观世界,表示客观世界中对象的可观测性,简称指物功能; 指向人的内部心智世界,表示心智世界的对象表示,简称指心功能; 指向认知世界,表示对象(客观世界、心智世界、认知世界)的符号名称,这些符号名称组成各种语言,简称指名功能.大致来说,语言的这三个功能,人切换自如,显然这是智能的根本.但是,图灵测试将智能的表现限定在指名功能里,塞尔构造了同样完全限定在指名功能里的中文屋问题[2],并利用该问题来说明即使机器通过图灵测试也不能说具有智能.
在人工智能研究早期,一般假设语言三指是等价的,换句话来说,只要将其中一个功能实现,其他两个功能自然实现.因此,专注于指物,即对应于人工智能中的行为主义学派; 专注于指心功能,则对应于人工智能中的联结主义学派; 专注于指名功能,即对应于人工智能中的符号主义学派.但是,日常生活里,语言三指不一定等价.
为了清楚地说明日常生活里语言三指不一定等价,需要深入研究语言.需要说明的是,这里所指的语言是广义的,包括自然语言、形式语言、手势语言、音乐语言等.目前,对于语言的研究已经取得了非常深入的研究成果,特别是对于其指名功能的研究.但是,一般依然假设语言的三指功能应该等价,这导致了很多困难和挑战.为了说清楚这个问题,需要考虑语言基本组成单位的三指功能的区别,即词的三指功能.
对于任何一个词,其经典表示具有三部分组成: 词名; 词的心智表示,又称内部表示,传统上用命题表示; 词的外延表示,又称外部表示,传统上用经典集合来表示,集合中的每个元素具有该词名.显然,词的经典表示具有指名、指心和指物功能,词名指名,词的心智表示指心,词的外延表示指物.具体说来,猫这个词,可以指猫这个词本身,即所谓的指名功能,也可以指现实世界中的一只猫,即所谓的指物功能,还可以指猫在人的心智世界中的表示,即所谓的指心功能.
词的经典表示具有很多假设: 如假设词的心智表示与词的外延表示具有同样的词名; 词的心智表示用命题表示; 词的外延表示用集合表示; 对同一个词来说,所有人对其具有相同的内外表示; 当指向具体对象时,同一个词的内外表示完全等价.上述假设合起来就是,词的指名、指心和指物功能完全等价.但是,日常生活中,这些假设不一定成立.比如,有心理学家证实[3],成人日均说谎一次,这清楚表明词的心智表示与词的外延表示不一定具有同样的词名; Wittgenstein的研究表明[4],词的心智表示不一定是命题表示,但是,这并不表明词的心智表示不存在,2016年4月,Nature杂志发表的封面文章再次证明词的心智表示存在,并绘制了大脑的语义图谱[5]; 模糊集合[6]的提出,表明词的外延表示也不一定用经典集合来表示; 涉身认知科学的研究表明词的内外表示可能会因人而异; 而词的内外表示完全等价相当于知行合一,显然对于日常生活来说,也是一个很难完成的任务.因此,指名、指心、指物三者很难完全等价,故研究指名、指心、指物这三者及其自身之间的关系与规律,一直是人工智能面临的难题和挑战.对于限定在词这一粒度下,我们已经对于词的经典表示做出了一个本质的改进,基本上放弃了对于上述提到的词经典表示的先验假设,同样可以具有词的经典表示的三指功能[7].但是,对于一般情况下,如何实现语言的三指功能,尚不清楚.按照个人的理解,王飞跃教授提出的平行系统[8],可以看作是语言的指名功能,主要是在人的认知世界里复现、设想、影响甚至控制对象,通过人的三指切换能力影响、控制处于三个世界中的对象.
需要指出的是,人工智能发展至今,在语言三指方面的研究已经取得了很大的进展.在指物功能方面,人工智能在图像、声音识别与生成方面进展非凡,车牌识别、人脸辨识、指纹识别、语音辨识等已经称为人们日常使用的成熟技术.在指心功能方面,人工智能在知识表示、情感计算等也进展迅速,深度学习在知识表示取得的成就更是令人印象深刻.在指名功能方面,人工智能在机器翻译、问答系统、搜索引擎等方面同样影响巨大.
但是,人类对于语言三指的关系与规律方面依然面临许多挑战.如在指物方面,主要的技术之一是机器学习,但机器学习一直有两个问题[9]: 适应不断出现的新学习任务的学习算法设计; 能够统管所有机器、生物和人的学习理论.应该说,第一个问题,研究非常之多,对于第二个问题,研究很少,笔者在机器学习的公理化方面做出了一些有意的尝试[10].在指心方面,同样存在两个挑战: 知识统一表示是否存在?更深刻的说法是: 如何确定真假?在指名方面,人们依然不清楚对话的计算机制,更进一步地说,通过图灵测试的理论机制或者计算机制是什么.李航[11]就明确指出: 我们还无法构建一个真正的"对话机器人",因为我们还不知道如何基于数学模型来实现,也不知道是否可行.当人工智能同时处理语言三指时,面临更大的挑战: 如何协调语言三指一致?在语言三指不一致时,如何适应环境?换一种说法,在未来实现指物、指心和指名三者功能各自实现的比较完善的情形下,如何使人工智能技术能像人一样在具体环境下,实现不等价的指物、指心和指名功能但不引起系统崩溃、具有很高鲁棒性或者适应性的智能行为,更通俗地说法是,未来是否可以使得计算机像人一样,能够到什么山上唱什么歌,见什么人说什么话.
为此,个人认为,未来需要进一步发展完善有关视听嗅触等多感知数据采集与处理理论与技术,机器学习等知识发现理论与技术,语言处理等知识表示理论与技术,最终推动完善机器人等需要语言三指功能的人工智能理论与技术等.
-
[1] [2] [3] [4] Wittgenstein L. Philosophical Investigations. Oxford: Basil Blackwell Ltd., 1953. [5] [6] [7] Yu J. Communication: words and conceptual systems. arXiv: 1507.08073, 2015. [8] [9] [10] Yu J. Generalized categorization axioms. arXiv: 1503.09082, 2015. [11] 期刊类型引用(2)
1. 赵京胜,宋梦雪,高祥,朱巧明. 自然语言处理中的文本表示研究. 软件学报. 2022(01): 102-128 . 百度学术
2. 薛扬,梁循,赵东岩,杜玮. 镜像图灵测试:古诗的机器识别. 计算机学报. 2021(07): 1398-1413 . 百度学术
其他类型引用(3)
-
计量
- 文章访问数: 1908
- HTML全文浏览量: 469
- PDF下载量: 1159
- 被引次数: 5