《美国宾夕法尼亚大学开发首个利用光进行非线性神经网络训练的可编程光子芯片,显著加速AI训练并减少能耗》

  • 来源专题:集成电路与量子信息
  • 发布时间:2025-04-16
  • 宾夕法尼亚大学的工程师们开发了首款可通过光训练非线性神经网络的可编程芯片,这一突破性进展有望显著加速人工智能的训练速度、降低能耗,甚至为全光计算机铺平道路。与当前依赖电力进行计算的电子AI芯片不同,新芯片是光子的,即使用光束代替电子束。这项研究重塑了光的行为,使其能够执行现代AI核心的非线性数学运算。 非线性函数对于训练深层神经网络至关重要。材料科学与工程教授兼电气与系统工程教授Liang Feng表示:“我们的目标是首次在光子技术中实现这一点。” 目前大多数AI系统依赖于模仿生物神经组织的神经网络,通过层层节点的连接来执行复杂任务。而在人工和生物系统中,这些节点仅在达到阈值后才会“激发”,这一非线性过程允许输入端的细微变化导致输出端更大、更复杂的变化。 此前,包括宾夕法尼亚大学在内的许多研究团队已经开发出了能处理线性数学运算的光芯片,但没有人解决仅用光表示非线性函数的挑战。Tianwei Wu(24年研究生)表示:“没有非线性函数,光子芯片无法训练深层网络或执行真正智能的任务。” 这项研究填补了这一空白,为未来更先进的光子AI系统奠定了基础。

    该研究于4月15日以题名“Field-programmable photonic nonlinearity”发表在《Nature Photonics》上,论文获取链接为:https://www.nature.com/articles/s41566-025-01660-x

  • 原文来源:https://techxplore.com/news/2025-04-programmable-photonic-chip-ai-energy.html
相关报告
  • 《前沿 | 宾夕法尼亚大学开发光学芯片来处理人工智能的复杂数学》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2024-02-23
    • 宾夕法尼亚大学的工程师开发了一种新的光学芯片,用于执行训练AI所必需的复杂数学运算。其开发人员表示,该芯片有可能“从根本上加快计算机的处理速度,同时降低其能耗”。 基于硅光子学的芯片的设计汇集了本杰明·富兰克林奖章获得者和 H. Nedwill Ramsey 教授 Nader Engheta 在纳米尺度操纵材料方面的开创性研究,以利用 SiPh 平台使用光进行数学计算。 宾夕法尼亚大学的声明说,“光波与物质的相互作用代表了开发计算机的一种可能途径,这些计算机取代了当今芯片的局限性,这些芯片基本上基于与1960年代计算革命早期的芯片相同的原理”。 在Nature Photonics的一篇论文中,Engheta的团队与电气和系统工程副教授Firooz Aflatouni的团队一起描述了新芯片的开发。“我们决定联手,”Engheta说,利用Aflatouni的研究小组开创了纳米级硅器件的事实。 他们的目标是开发一个平台来执行所谓的向量矩阵乘法,这是神经网络开发和功能的核心数学运算,神经网络是当今人工智能工具的计算机架构。 Engheta说,而不是使用高度均匀的硅晶圆。“你使硅更薄,比如150纳米,”但仅限于特定区域。这些高度的变化 - 不添加任何其他材料 - 提供了一种控制光通过芯片传播的方法,因为高度的变化可以分布以导致光以特定模式散射,从而允许芯片以光速进行数学计算。 Aflatouni说,由于生产芯片的商业代工厂施加的限制,这种设计已经准备好用于商业应用,并可能适用于图形处理单元,随着对开发新AI系统的广泛兴趣,对图形处理单元的需求猛增。 “他们可以采用硅光子学平台作为附加组件,”Aflatouni说,“然后你可以加快训练和分类速度。 除了更快的速度和更低的能耗外,Engheta和Aflatouni的芯片还具有隐私优势:由于许多计算可以同时进行,因此无需将敏感信息存储在计算机的工作内存中,这使得由这种技术驱动的未来计算机几乎无法破解。“没有人可以侵入不存在的内存来访问你的信息,”Aflatouni说。
  • 《前沿 | 美国宾夕法尼亚大学:逆向设计高集成度硅基光计算芯片》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2024-02-26
    • 逆向设计高集成度光子集成器件是近年来的前沿热点研究方向。近日,美国宾夕法尼亚大学Vahid Nikkhah,Nader Engheta等学者提出了高效率仿真新方法,逆向设计了大矩阵维度的光学向量-矩阵乘法计算芯片。传统的逆向设计过程中,光场仿真时间随器件面积指数级增长,这限制了器件的设计面积与矩阵计算维度。 本文中提出的方法p2DEIA,基于光传播的二维有效折射率近似,能够大幅缩减逆向设计仿真时间,突破传统方法在器件面积上的限制,从而设计大矩阵维度的光学向量-矩阵乘法芯片。此外,由于p2DEIA方法对折射率的约束,该芯片具有无定形透镜型结构,可以避免谐振特征引起的窄带宽和制造误差敏感性,这在实现大规模集成的光计算芯片中发挥关键作用。相关成果发布在Nature Photonics上。 逆向设计光计算芯片:算法与芯片融合创新 光计算芯片是利用光进行低功耗、高速度、高并行度的计算。其中,最为关键的一类片上光计算芯片就是光学向量-矩阵乘法器,特别是在神经网络计算中,矩阵乘法占据了80%以上的计算量。近年兴起的逆向设计方法特别适合这类器件设计,理论上具备亚波长尺度近乎“任意”调控光场的超强设计能力,可实现超高集成、超强性能的光学向量-矩阵乘法器。然而,逆向设计的优化过程需要数百次3D光场仿真,而3D光场仿真的仿真时间会随器件面积指数级增长,这导致传统方法的设计面积被限制在几个平方微米,无法设计出大矩阵维度的光学向量-矩阵乘法器。 为了解决这个问题,文中提出一种压缩光场仿真时间的方法——基于传播的二维有效折射率近似(propagation-based 2D effective index approximation, p2DEIA)。该方法可以显著减少逆向设计过程中的光场仿真时间,并且基于该方法设计出的芯片具有无定形透镜型器件结构,这种结构的刻蚀区硅厚度呈现缓变状态,可以降低谐振特征引起的窄带宽和制造误差敏感性。相关研究人员利用该方法,将设计面积提升至几十个平方微米,并成功设计出大矩阵维度 (3×3和10×10)的光学向量-矩阵乘法器。实验结果表明,该乘法器的实测性能与仿真性能非常接近,这为实现大规模集成的光计算芯片提供了新的方法和思路。 高效算法助力新型结构设计 图1 (a) p2DEIA方法示意图(b)无定型透镜结构示意图 图2 向量-矩阵乘法器设计示意图 图3 向量-矩阵乘法器实验测试结果 文章中提出的p2DEIA方法,是基于光传播的二维有效折射率近似,对硅基光芯片的三维结构的进行高速仿真,该方法可以显著少逆向设计过程中的光场仿真时间成本。如图1所示,p2DEIA方法基于光传播的二维有效折射率近似,根据斯涅尔定律仿真设计区域中硅厚度变化引起的光波的反射和透射,对设计区域中的光场传播的进行仿真,大幅度缩减逆向设计过程中的仿真时间。在仿真精度上,当设计区域中的硅厚度缓变时,p2DEIA方法的仿真结果与传统3D光场仿真非常接近。基于该方法进行逆向设计时,会使器件接近硅厚度缓变的无定形透镜结构,这种结构可以避免谐振特征引起的窄带宽和制造误差敏感特性。 相关研究人员利用该方法突破了仿真成本造成的逆向设计面积瓶颈,并成功设计出了大矩阵维度的光学向量-矩阵乘法器,可以完成1×N向量与N×N矩阵的乘法。如图2(a)所示,基于220 nm的标准SOI平台,有N个500 nm的输入波导与N个500 nm的输出波导,波导中基模的复振幅携带输入与输出向量,其中输入输出向量之间的复数域传播参数与矩阵元素数值相对应,该团队将这些矩阵元素作为设计目标,使用基于p2DEIA的逆向设计方法,对器件硅层厚度进行设计。如图2所示,该团队设计了矩阵维度分别为2×2、3×3和10×10向量-矩阵乘法器,这三个器件的设计面积分别为10 μm×11 μm、23 μm×34 μm、和29 μm×35 μm,设计面积相较传统方法提升了几个数量级,并且这种结构可以避免谐振特征引起的窄带宽和制造误差敏感性。 芯片标准工艺制备和测试 研究人员基于新加坡先进微晶圆厂(Advanced Micro Foundry,简称AMF)的180 nm工艺制造了相关器件,该工艺允许两种不同深度的蚀刻,设计中使用了较浅的70 nm蚀刻深度。如图3(a)所示,本文展示了3×3向量-矩阵乘法器。为了验证本文提出的p2DEIA方法的仿真精度,对器件在工作波长(1.525 μm)的透射系数进行了统计,分别统计了基于p2DEIA方法的仿真、传统3D仿真、实验测量与设计目标对应的透射系数,图3(b)(c)依次展示了2×2向量-矩阵乘法器和3×3向量-矩阵乘法器的统计结果,结果表明本文中的p2DEIA仿真结果与传统3D仿真、实测结果、设计目标非常接近,这说明基于p2DEIA方法的仿真非常精准。为了进一步验证p2DEIA方法的宽带特性,图3(d)(e)依次展示了2×2向量-矩阵乘法器和3×3向量-矩阵乘法器的宽带光谱测量结果。可以看到,器件光谱对波长变化不敏感,该器件可以在60 nm的宽带范围工作,说明基于p2DEIA方法设计出的器件可以避免谐振特征引起的窄带宽特性。 总结与展望 在这项工作中,研究人员提出了逆向设计新方法,解决了传统逆向设计中仿真时间随器件面积指数级增长的瓶颈问题,突破了器件面积的限制,设计了大矩阵维度的光学向量-矩阵乘法芯片。同时,提出的新方法和新结构可以避免谐振特征引起的窄带宽和制造误差敏感特性。研究人员利用该方法设计了3种向量-矩阵乘法器芯片,矩阵维度分别是2×2、3×3和10×10,并进行了相关器件测试。该工作采用的设计方法和思路为实现大规模高集成度光信号处理芯片提供了新路径。