【导读】一篇研究文章从数学理论上证实了AI模型可以完全模拟神经元和突触的信号,在更强算法、更大算力的加持下,可以精确模拟大脑及其功能系统,在无约束的情况下未来AI百分之一百会超越人类智能,甚至发明创造能力也是如此。
人工智能领域已经发展了70年,从小数据验证,到大规模基准,再发展到现在,几乎每天都有新突破,不只是在简单问题上超越普通人类水准,在最难的问题上也能和顶尖人类掰掰手腕了。
但还有一个自人工智能诞生以来就一直广为讨论、看是无解的关键问题,各方业内人士仍然争辩不休:如果没有适当的限制和治理,人工智能在未来是否会发展到超越人类智能?
最近,来自东南大学、哈佛医学院、新加坡国立大学、新加坡南洋理工大学、新加坡国立脑科学研究院、清华大学、中山大学等多达15个顶尖机构的研究人员联合发表了一篇论文,在理论上证明了AI超越人类的可能性,即通过结合神经科学中的新型AI技术,可以创建出一个新的AI智能体,能够在细胞层面上精确模拟大脑及其功能系统(例如感知和认知功能),并且预期误差极小。
也就是说,没有限制的人工智能最终必然(probability one)超越人类智能。
论文链接:
https://www.sciencedirect.com/science/article/pii/S0925231224018241
类似数学和物理的区别一样,在不对AI技术施加限制的情况下,必然会分化出一个新学科,发展出不同的系统和原理。
研究人员估计,这篇论文将开启多个全新的研究方向,包括:
1. 在神经科学的动态分析、大脑功能分析和脑疾病解决方案中,使用AI智能体和其他AI技术进行细胞层面的高效分析;
2. 建立一个新的全球合作计划,让跨学科团队同时使用AI技术研究和模拟不同类型的神经元和突触,以及大脑不同层级的功能子系统;
3. 在基础神经科学属性的帮助下,开发低能耗的AI技术;
4. 开发新的可控、可解释且安全的AI技术,这些技术具有推理能力,能够发现自然界的原理。
宏观与微观的人脑
人脑,可以说是全宇宙最复杂的系统之一,可以处理和解释各种感觉信号,包括视觉、听觉、温度等,并通过学习、记忆、推理、思考和情绪调节来管理认知识别,以控制人体的所有调节功能。
人类的大脑中包含数百种不同类型的生物神经元,通过大量突触进行生物连接:
1. 人脑中的生物神经元数量虽然数量很多,但仍然是有限的,比如成年人平均有大约860亿个神经元,其中160亿个神经元在大脑皮层中。
2. 突触是神经元在大脑中相互连接和交流的连接点,大脑中的突触数量也是有限的。每个神经元包含几个到几十万个突触连接,用于与「自身」或「跨越大脑各个区域」的邻近神经元或神经元连接。
3. 神经元和突触的数量是衡量人类智能的关键参数。
在宏观层面,大脑可以看作是由数百亿神经元和数万亿突触组成的复杂系统,整体具有反馈功能。
在微观层面,神经元和突触的表征可以通过数学建模和分子行为(molecular behaviors)来解释,现有方法主要从神经科学动力学(neuroscience dynamics)的角度对不同类型的神经元和突触进行研究。
通用、统一的神经元数学表征
大脑中的不同系统层次是非线性和动态的,如果同时考虑微观和宏观进行数学建模,几乎有无限的可能性和功能,也就无法对大脑进行简洁的分析;但如果分开考虑,对不同类型神经元估计不准确,就会导致数学模型与大脑功能之间的累积误差无法控制。
研究人员选择关注「基本神经元和突触」和「细胞层面」的AI技术,同时考虑了「大脑构建模块」的四个基本属性:
1. 大脑的基本信号和通信功能主要由「生物神经元」和「生物突触」驱动;
2. 神经元和突触都向其他神经元单向传递信号;
3. 生物神经元和生物突触依次交替连接;
4. 神经元遵循「全有或全无定律」:如果一个神经元响应,就必须完全响应。
想要对数百种「神经元」进行通用、统一的数学表示,就不能考虑不同的尖峰表示和神经元动态机制的基本功能,研究人员采用一种新的「AI孪生」(AI twin)方法,利用人工智能模型来表示单个神经元和突触,模型无需了解神经元和突触中电信号传导的细节以及相关的数学建模和单个神经元和突触中的分子行为。
从生物特性上来看,神经元和突触的功能可以看作是分段连续的,其生物反应对接收信号是相当平滑的,可以分为三个分段连续函数:
1. 尽管神经元的信息编码仍然是未知的,但信息编码机制和相关的尖峰概率可以看作是一个分段连续的函数
2. 时间延迟变量遵循某个分段连续机制
3. 如果与概率函数一起考虑,神经元的信号传输函数是分段连续的
从本质上讲,单个神经元能否被激发到发射状态取决于通过其树突树接收的整合输入信号。也就是说,神经元树突的输入信号与轴突末梢的输出信号之间的输入-输出关系函数,是一个动作电位函数和轴突机制的复合函数,是非线性的分段函数,包括神经元接收的所有兴奋性和抑制性信号。
假设一个生物神经元L在其树突树中有输入信号xL,其突触前末梢的输出信号是
,其中AL(x)代表神经元树突的输入信号与轴突末梢的输出信号之间的信号传输函数,包括膜电位和通道状态之间的概率和时间延迟,并且也是分段连续的。
与神经元的动作电位一样,第P个突触的神经递质传递关系,即神经元轴突末端的突触前末梢与下一个连接神经元的突触后末梢之间的关系Sp(x),也是(分段)连续的。
人脑可以看作是由两个基本元素的函数(AL,SP)组成,即单个神经元的信号传输关系AL在树突树与其轴突末梢之间,相应突触内的神经递质传递关系SP,其中L的范围从1到860亿。
对比大脑,从架构的角度来看,大脑由两个基本元素组成:神经元和突触。
从理论的角度来看,大脑系统是两个基本分段连续函数的复合组合:单个神经元的信号传输关系,控制着其树突接收的输入信号与从其轴突末梢发送的输出信号之间的信号传输AL,以及相应突触内的神经递质传递关系SP。
自下而上:大脑与AI的结合
神经元在生理区域进行集成,并在大脑中产生功能属性和状态,包括学习、记忆、推理、思考、感觉、情绪、视觉、听觉等在内的人类大脑系统,即,由神经元的信号传递关系AL(x)及其对应突触内的神经传递关系SP(x)的有限数量的连续组合构成。
也就是说,自下而上地看,人类大脑可以看作是由神经元和突触的层(layer)和组(group)构成的结构,每一层和组都建立在其他的层和组之上。
与通常采用的生物神经元的尖峰(spiking)表示和神经元动力学机制不同,可以利用AI技术的学习与建模能力(而不是数学建模方法)来近似神经元,而不需要了解具体的生物特性。
AI近似单个神经元和单个突触
众所周知,如果单隐藏层前馈网络(SLFN)的隐藏节点激活函数是有界非恒定连续的,那么任何目标连续函数f都可以被SLFN近似,误差δ可以任意小。
因此,给定任意单个神经元的信号传递关系AL(x),其树突树和轴突的突触前末梢之间,存在一个人工神经网络可以近似该函数,误差可以任意小。
同样,给定任意相应突触内的神经递质传递关系SP(x),存在一个人工神经网络可以通用地近似SP(x),误差可以任意小。
在实现时,可以使用各种架构模型,包括但不限于全连接前馈网络、卷积神经网络、变换器、极限学习机(ELMs)等。
AI近似大脑及子系统的学习能力
神经元遵循「全有或全无定律」(all-or-none law),如果一个神经元响应,它必须完全响应;突触的功能可以被看作是全有或全无的平滑:
1. 突触的非线性函数可能没有统一的值;
2. 大脑的片段/区域层面的函数和系统通常不是统一的;
3. 单个生物神经元的发射和抑制周期是有限的。因此,对于任何合理的持续时间,神经元中可能没有无限数量的振荡/尖峰和突触中的信号传递,单个神经元和突触的非线性函数是分段连续的;
4. 神经元可能通过膜电位的变化(分级电位)进行通信,电位更接近「模拟」信号而不是「离散」尖峰。
在这种情况下,神经元的表现可以看作是数学上「全有或全无平滑函数」(all-ornone smoothness function)的一个特例:
1. 如果一个生物神经元在接收到其树突树的信号后响应,则必须完全响应;
2. 生理上,如果一个神经元被激发,其轴突将总是产生一个统一幅度的电冲动,其高度无论刺激的强度或持续时间如何都保持不变。神经元轴突要么完全传递最大响应穿过突触到下一个神经元,要么一点都不传递。
3. 全有或全无平滑函数不仅包括在大脑神经元中观察到的心理全有或全无定律,还包括突触中的分段连续函数。
大脑全有或全无平滑保持的一般定理(All-or-None Smoothness Preservation)
假设所有函数f, f1, f2, ..., fk都是全有或全无平滑分段连续的,那么f(f1, f2, ..., fk)是全有或全无平滑分段连续的,因此,由顺序链接的神经元和突触构成的人类大脑及其任何构成区域都是全有或全无平滑分段连续的。
大脑由AI孪生表示的一般定理(Brain-AI Representation)
给定任何(子)系统和大脑区域的函数f,以及顺序链接的神经元和突触,以及任意正值δ,存在一个模型使得
。
神经元的连接和电路很像,虽然每个电路元件都具有不同的属性,并且输入输出都依赖于其他与之相连的其他元件,但每个元件都可以单独拿出来进行分析,设计者可以在不考虑整体电路功能的情况下,对任意元件进行替换。
与抽象的数学系统不同,大脑作为一个物理系统,其不同功能是由一系列物理连接的生物神经元和突触(包括电突触、体积传输和电子耦合等)产生的,理论上大脑表示的一般定理适用于所有由大脑中顺序连接的神经元和突触构建的功能。
因此,理论上,文中提出的基于自下而上的AI孪生方法,也能够具有类似大脑的能力,而不需要识别和理解大脑中由生物神经元和突触顺序表示时产生的所有「不同类型」的功能。
没有限制,AI必然超越人类智能
根据上面这些理论,可以看出,对于任何给定的单个神经元和突触,都存在能够通用近似的AI模型;通过自下而上的解决方案,可以利用组合来近似大脑及其顺序链接的区域/子系统,预期误差很小。
如果没有适当的限制和治理,最终AI模型必然超越人类大脑的智能。
下面是研究人员总结出的「促使AI指数级增长」的部分关键因素,也是需要保障AI安全的有效措施。
1. 算法:人工智能网络/解决方案中的人工神经网络或组件可以被更高效或显著更简单的替代品替换,例如,各种类型的高效网络架构、信号处理技术和数学解决方案,算法可能会进一步自我演化。
2. 数据源:AI传感器可能比人类的器官(眼睛、耳朵、鼻子、舌头和皮肤)具有更广泛的感知能力,比如「听」更广泛的频率,「看」到红外光谱,「闻」到更细微的气味等。
3. 计算能力:理论上,世界上可以连接和集成无限数量的计算芯片、传感器、设备和服务器(通过实验室、组织、地区、国家等),肯定远远超过单个大脑的神经元数量。
4. 智能材料:AI技术也可以由包括但不限于神经形态、光子学、忆阻器、相变材料、纳米材料等在内的广泛类型的智能材料实现和支持,实现更高的性能、能效。
5. AI智能体:可以在芯片、传感器、设备、机器人、流程、系统、云等多端进行部署,未来可能远超人口数量。
6. 知识交换和继承:每一代人类通常需要20年或更长时间才能从祖辈那里继承部分能力,通过各种社会活动以不同的方式共享和交换知识,而AI可以时刻持续更新知识。
脑疾病或可攻克
和大脑一样,文中提出的AI孪生同样能够提供相当多的功能,并且能够提供针对大脑个别神经元、突触或大脑小区域提供替代解决方案,前提是解决伦理问题。
在理想情况下,如果某个人的大脑部分区域发生损害,研究人员可以设计一个细胞级纳米(甚至更小)尺寸的人工智能芯片,从神经元和突触开始,自下而上地帮助恢复或模仿生理功能。
理解神经元层面的详细结构信息对于未来实现「人工智能神经元替代疗法」至关重要,主要取决于在细胞层面准确测量功能的增益和损失。
如果可以在神经层面对大脑结构进行扫描,类似于MRI或CT,识别出受损或病变的神经元区域,才能进一步考虑开发AI组件进行替换,未来可以考虑使用智能材料和计算节点在神经元、突触和蛋白质层面检测或识别「功能增强」或「功能丧失」的信号。
作者介绍
第一作者黄广斌教授是东南大学首席教授、新加坡南洋理工大学电气与电子工程学院终身教授。
他在2004年提出了极限学习机(ELM)算法,为传统神经网络提供理论支持,学习速度比深度学习快上万倍,被广泛应用于多个领域。
此外,他的2篇AI学术文章在2017年被谷歌学术列为世界上「过去10年经过时间验证的Top10人工智能经典文章」中分列Top 2和Top 7。
他提出的AI理论最近也得到了生物和脑神经学的直接生物验证,弥补了机器学习和脑学习机制之间的空白,解决了计算机之父冯·诺依曼60年前的关于人脑和计算机结构和能力的困惑。
他提出的AI理论和算法被广泛应用于电力、能源、太空、控制、低功耗AI芯片光子芯片等领域以及被美国太空总署NASA、IBM等应用。
2014年起连续9年被汤申路透评为「高被引用研究者」及「世界最有影响力的科学精英」,位列斯坦福大学2021年Top 2%世界科学家新加坡南洋理工大学中的第一名。