实现快速光学神经网络,
全光非线性激活函数是关键组成部分。然而,随着集成光学神经网络在线性矩阵计算方面的不断进步,片上全光非线性激活器面临着一系列挑战:包括集成度低、延迟高、功耗大和激活阈值高。为了应对这些挑战,中国科学院上海光机所王俊研究员、浙江大学邱建荣教授和之江实验室谭德志研究员合作开发了一种创新的集成非线性光学激活器,采用二维过渡金属二硫属化物与光波导对接耦合的设计。在可见光到近红外波长范围内展现出超宽带响应,激活阈值低至0.94μW,器件尺寸仅约50μm2,同时具备高达2.08 THz的超快响应速度和优异的集成密度。这一先进的激活器被应用于模拟MNIST手写数字识别,准确率高达97.6%。此外,对于更复杂的CIFAR-10图像分类任务,其准确率也高达94.6%。相关研究成果发表在Nature Communications上。
宽带非线性材料,助力高效计算
光子集成器件因具有高速光子传输、强大的并行处理能力以及低功耗的特点,近年来引起了广泛关注,成为实现快速高效计算的新兴方案。人工神经网络的概念已被引入光子学领域,形成了光学神经网络,这在光子集成电路和自由空间光学中均显示出了可行性。这些网络灵活地结合了线性与非线性操作,其中非线性操作在光学硬件平台上实现非线性激活函数,对于网络的训练和决策过程至关重要。然而,构建全光非线性激活器面临一些挑战,特别是在介质中非线性响应不足以支持光子器件发挥神经元的功能。尽管研究人员已经发现了一些强非线性材料,并设计了基于相变材料的增强非线性结构,但这些相变材料往往具有较长的恢复时间,并需要额外的能量刺激,限制了其在高速光计算中的应用。此外,基于二维材料和衰减场耦合的全光非线性激活方式通常伴随着较高的光损耗,导致激活阈值增加和能耗上升,从而在实际应用中缺乏能效优势。
为了解决这些问题,该研究提出了一种创新的集成非线性光学激活器,该器件基于对接耦合的二维材料和通过飞秒激光在玻璃基质上构建的光波导(如图1所示)。通过集成二维MoTe2与光波导,该非线性激活器能够依赖对接耦合机制进行高效的光学激活。玻璃的透明特性使得该器件能够在超宽带下高效工作,相较于传统方法,这种新颖的设计显著增强了光与物质之间的相互作用,光能够直接穿过集成的光学有源器件进行光信息调制,从而减少光损耗。此外,嵌入光波导的玻璃基质作为优良的支撑平台,提供了独特的优势,这在其他波导(如硅波导)中是难以实现的。相关研究人员利用这一非线性激活器成功进行了手写数字识别和彩色图像分类,取得了优异的准确率和卓越的性能。这项研究不仅推动了光子集成技术的发展,也为未来高速光计算的实现铺平了道路。
图1集成全光非线性激活器
非线性激活器测试与功能验证
研究人员对非线性激活器的非线性光学效应进行了深入测量,成功获得了四种在可见光至近红外范围内的非线性激活函数。结果显示,这四个激活函数的非线性阈值分别为47.8μW、14.2μW、21.7μW和5.5μW。通过优化MoTe2的厚度,激活阈值可以降低到4.9μW。此外,研究小组还运用瞬态吸收光谱和泵浦-探针技术,深入探讨了非线性激活核心材料中载流子弛豫的动态过程。在515 nm和1040 nm波长下,载流子的快速响应时间分别为0.48 ps和0.69 ps。这一研究表明,该全光非线性激活器的响应速率在515 nm时高达2.08THz,而在1040 nm时也达到了1.45 THz,为实现超快信息处理提供了新的思路。
图2MNIST手写数字识别
将测量得到的四种非线性激活函数应用于模拟MNIST手写数字识别,结果如图2所示。测试表明,数据集的准确率分别为96%和97.4%。经过优化选择MoTe2的厚度后,识别准确率更是提升至97.6%。为了检验这些非线性激活器的广泛适用性,研究团队进一步在更具挑战性的CIFAR-10数据集上进行了训练。相比于MNIST,CIFAR-10的数据不仅形状更复杂,颜色也更加丰富。经过250个训练周期后,该激活器能够轻松识别和分类10种不同的RGB图像,如图3所示,其测试准确率分别达到了94.6%和94.3%。更令人振奋的是,这种非线性激活器展示了超低功耗的特性,功耗仅为0.94 μW,且单个设备的尺寸约为50 μm2,比之前的研究结果小了一个数量级。这一突破不仅提高了识别精度,还显著降低了能耗,为光学信息处理技术的未来发展开辟了新路径。
图3CIFAR-10图像的分类
总结与展望
在这项研究中,科学家们巧妙地结合了二维MoTe2和光波导平台,成功开发出一种集成的全光非线性激活器。这种激活器不仅拥有超低的激活阈值,低至0.94μW,远远超过以往的水平,而且展现出超快的计算速度和宽带响应特性,使其在灵活性和应用潜力上有了显著提升。得益于其宽带光学非线性效应,这款激活器能够以高达2.08 THz的频率迅速响应,极大地加快了信息处理的速度。这一突破不仅为光子计算系统的高速、超宽带和高密度集成开辟了新的可能性,也为未来的信息技术发展指明了方向。
相信随着科学家们不断深入研究和实验,未来光学非线性激活器、光学神经网络将在光计算、人工智能、图像识别、数据分类等领域发挥重要作用。