该研究介绍了一种新型光子芯片,可以在
当今最苛刻的机器学习应用所采用的深度神经网络模型已经变得非常庞大和复杂,突破了传统电子计算硬件的极限。
光子硬件可以基于光进行机器学习计算,是一种速度更快、更节能的替代方案。但是,有些类型的神经网络计算光子设备无法执行,需要使用片外电子设备或其他会影响速度和效率的技术。
经过十年的研究,麻省理工学院等机构的科学家开发出了一种新型光子芯片,可以克服这些障碍;展示了一种完全集成的光子处理器,可在芯片上以光学方式执行深度神经网络的所有关键计算。
该光学设备能在不到半纳秒的时间内完成机器学习分类任务的关键计算,同时实现超过92%的准确率——其性能与传统硬件相当。
该芯片由形成光学神经网络的互连模块组成,采用商业代工工艺制造,可实现该技术的扩展并将其集成到电子产品中。
从长远来看,光子处理器可实现更快、更节能的深度学习,适用于激光雷达、天文学和粒子物理学的科学研究或高速电信等计算要求高的应用。这项研究已由量子光子学和人工智能组及RLE首席研究员、论文高级作者Dirk Englund、Saumil Bandyopadhyay ’17等研究人员发表在《自然光子学》杂志。
利用光进行机器学习
深度神经网络由许多相互连接的节点层或神经元组成,这些节点层或神经元对输入数据进行操作以产生输出。深度神经网络中的一个关键操作是使用线性代数进行矩阵乘法,这会在数据从一层传递到另一层时对其进行转换。
但除了线性运算,深度神经网络还执行非线性运算,帮助模型学习更复杂的模式。非线性运算(如激活函数)使深度神经网络能解决复杂问题。
2017年,Englund团队与Marin Soljačić(塞西尔和艾达格林物理学教授)实验室的研究人员合作,在单个光子芯片上展示了一种光学神经网络,可以用光进行矩阵乘法。
但当时该设备无法在芯片上进行非线性运算,必须将光学数据转换成电信号,再送到数字处理器进行非线性运算。
Bandyopadhyay解释:“光学中的非线性非常具有挑战性,因为光子之间并不容易相互作用。这使得触发光学非线性非常耗电,因此构建一个可扩展的系统变得具有挑战性。”
他们通过设计一种称为非线性光学功能单元(NOFU)的设备克服了这一挑战,该设备结合电子学和光学技术在芯片上实现非线性操作。
研究人员利用三层执行线性和非线性运算的设备,在光子芯片上构建了光学深度神经网络。
我超越了光[得瑟][得瑟]