大量无人车的上路试行让人工智能技术俨然变身老司机;
各大修图软件内的美颜功能则足以媲美经验丰富的整容医生;
而应用于各类会议中的语音识别技术甚至堪比训练有素的速记员……
种种技术的落地让人工智能仿佛就要超越人类,但其在常识认知层面的欠缺仍是现阶段研究难以逾越的一座大山。
尽管在各类数据分析的速度和精确度上,人工智能远超人类,但说到生活常识的储备,人工智能目前的水平还不如一名10岁儿童。
一个简单的例子可以令这一问题具象化。“2008年北京奥运会上,运动员菲尔普斯在400米蝶泳项目中摘得金牌。”当一个正常心智的人甚至是儿童在获取这一段信息时,潜意识中一定会立即出现无数理所当然的事实:如菲尔普斯在比赛中一定是身着泳装的、菲尔普斯的金牌一定挂在脖子上等等。这些与原始信息关联的事实,实际上是每个人在长期的生活过程中积累的经验,这类经验就叫“常识”,而要想将这些常识输进一台人工智能机器,现阶段来说是难上加难。
之前曾有研究人员试图将人类常识以数据形式输入机器,但从研究进展来看,缺乏可行性。
上世纪80年代,斯坦福大学教授Doug Lenat主持了一个名为Cyc的项目,该项目由美国政府和数家大型科技公司资助,致力于将人类从幼儿时期积累的所有常识进行数字化,如“人不能同时出现在两个地方”“要用杯子喝水先得打开杯盖”。
但直至目前,这项工作仍未完结,并且已经耗费数千万美金。
作为Cyc项目的资助人之一,微软联合创始人保罗·艾伦已于日前启动了一项旨在教授人工智能常识的新计划,他认为结合此前已取得的技术进展,现在是时候采用一个全新的方法解决这一问题了。
据悉,本月初,艾伦已向其所创办的艾伦人工智能研究所(Allen Institute for Artificial Intelligence,简称AI2)投入1.25亿美元,其中一部分将用于运作上述这一新计划——“亚历山大计划”。
亚历山大计划的基本构想与Cyc项目类似,希望在未来几年内能建立起一个由人类已掌握的所有常识组成的数据库。虽然有新一代技术加持,但从持续了三十年仍未解决问题的Cyc来看,亚历山大计划真的是“压力山大”——常识数据化之路任重而道远。
另外,介于本次投入的数额是AI2在未来三年内原预算的两倍,艾伦肯下如此大手笔,正说明该目标一旦达成,将产生极大的应用价值。
广泛应用的自然语言处理、自动驾驶技术以及语音识别技术等皆是认知技术的延伸,而认知技术的基础则有赖于常识。
以诞生自麻省理工学院的自动驾驶初创公司iSee的研究为例,“掌握常识”可以让自动驾驶汽车更好地应对意外情况。其联合创始人YibiaoZhao说:“人类的思维对物理学和社会线索非常敏感,目前的人工智能在这些领域相对有限,我们认为这实际上是驾驶中缺失的一环。”
人类司机做出的驾驶行为总是依赖于常识。比如我们知道公交车需要更长时间才能停下来,而且会突然涌出大量行人,这个时候我们可以根据这一常识明智地作出判断,而缺乏这一常识的无人车则不能,它需要工程师将这一情况编排进程序才能做出反应,而想要预设出所有的交通状况根本不现实。
此前特斯拉汽车曾在中国发生一起交通事故。当时这辆车径直撞上了一辆街道清洁车,理由是该辆特斯拉搭载的系统一直在以色列和欧洲接受测试,而当地没有这种清洁车。也就是说,这一套系统并不能真正理解“清洁车”这一常识概念。
目前iSee正在让机器具备常识这一方向上进行努力,而如果AI2这一非营利机构能够在亚历山大计划上找到突破口,则能造福一大批像iSee一样的产品初创公司,届时艾伦花费的1.25美元绝对是物超所值了。