《探索 | 基于深度学习的光子学结构设计》

  • 来源专题:光电情报网信息监测服务平台
  • 编译者: husisi
  • 发布时间:2020-10-10
  • 导读
    近日,美国东北大学刘咏民教授的课题组与佐治亚理工学院、普渡大学的合作者在光学领域顶级期刊《Nature Photonics》上发表综述文章“Deep learning for the design of photonic structures”,系统回顾了近年来基于深度学习的光子学结构设计这一蓬勃发展的新兴领域的最新研究进展(文章链接:https://www.nature.com/articles/s41566-020-0685-y)。论文第一作者为美国东北大学博士后马蔚(现为浙江大学特聘研究员),通讯作者为美国东北大学刘咏民教授、佐治亚理工学院蔡文山教授和普渡大学Alexandra Boltasseva教授,佐治亚理工学院的Zhaocheng Liu博士和普渡大学的Zhaxylyk A. Kudyshev博士亦对本文的撰写有重要贡献。
    研究背景
    光子学结构设计是光电子器件和系统设计的核心。许多人工设计的光子学结构,比如超构材料、光子晶体、等离激元纳米结构等,已经在高速光通信、高灵敏度传感和高效能源收集及转换中得到了广泛应用。然而,在该领域中通用的设计方法是基于简化的物理解析模型及相关经验完成的。尽管这种方法可以得到所需的光学响应,但其从本质上说是基于错误的反复尝试(trial-and-error)并且通常依赖于耗时的数值计算来完成,从而导致效率很低并且很可能错过最佳的设计参数。
    在过去的几年中,统计机器学习方法在语言识别、机器视觉、自然语言处理等领域发展迅速。利用多层神经网络的深度学习更是近年来该领域的最火热的方法之一。深度学习通过数据驱动的思想建模,不直接引入人为设定的规则,而是从大量数据中学习得到研究目标的规律与特征。这为解决上述光子学结构设计面临的问题提供了崭新的方向。本综述论文从不同的深度学习模型结构出发,分类介绍了不同模型在光子学设计领域中的适用范围和选择依据,同时对比了深度学习模型与常规反向设计方法的区别与优劣,最后对该领域未来的发展趋势做出了展望。



    图一. 以数据驱动的建模思想作为基础,对于超构材料、光子晶体、等离激元纳米结构及硅光器件可以设计相应的深度学习模型建立其光学响应(偏振、波长、相位、轨道角动量等)与结构设计(材料、几何形状、空间分布等)之间的联系。
    创新研究
    1.多层感知机模型
    多层感知机是最基本的一种神经网络模型,由多层的全连接神经元组成,通过训练后,可以有效建立起输入到输出的映射关系。在光子学结构设计中,往往采用两个首尾相连的双向神经网络结构,同时实现光学响应的正向预测和光子结构的反向设计,图二给出了利用多层感知机对等离激元纳米结构、手性超构材料、多层纳米小球、光学拓扑绝缘体及硅基光电子器件等光子学结构的设计结果。



    图二. 基于多层感知机的深度学习模型在光子学结构设计中的应用。
    2.其他先进的深度学习模型
    多层感知机虽然结构简单且训练容易,但由于仅仅采用了全连接的结构,并不能适用于所有的光子结构设计问题。本小节回顾了其他一些更先进的深度学习模型结构及其在光子结构设计中的应用,例如卷积神经网络可以有效捕捉局部关联的特征,循环神经网络适用于时间序列特性的预测,深度生成模型可以通过概率生成的方式实现结构化输出,解决设计中的一对多问题。图三给出了这些先进深度学习模型框架在光子学设计中的应用。



    图三. 卷积神经网络、循环神经网络、深度生成模型等先进深度学习模型在光子学结构设计中的应用。
    3.深度学习模型与其他优化算法的融合
    深度学习模型本身是数据驱动的模型,一旦训练完成便可以针对需求进行快速的设计和优化,这与常规的数值优化算法是完全不同的。因此可以利用常规数值优化算法针对单个目标迭代优化的方式,与深度学习数据驱动的方式相结合。比如利用生成对抗网络与拓扑优化结合、自编码器与遗传算法结合等,可以更高效、准确地解决光子学结构的设计问题。



    图四. 深度学习模型与其他优化算法相结合解决光子学结构的设计问题。
    总结
    本综述文章介绍了深度学习在光子学结构设计中的应用。作为数据驱动的模型范式,深度学习在光子学结构设计、光学性能预测及优化中都有着出色表现,但同时也面临着新的挑战与机遇。例如,如何利用深度学习模型的泛化能力去表征除了光谱之外更复杂的光学特性,如何解决或缓解深度学习模型对训练数据量的要求,如何将深度学习与其他优化算法相结合去发掘更大设计空间中的全局最优解等等。相信随着后续的深入研究,深度学习在光子学结构设计中将被更广泛使用,从而形成一套高速、准确的光子学设计新框架,同时有望突破常规经验设计无法完成的设计任务。

相关报告
  • 《探索 | 基于氮化硅的单光子发射器》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2023-01-29
    • 伴随着量子技术的高速发展,越来越多的科研人员把目光转向量子通信、量子计算、量子模拟等实际应用,人们坚信量子技术将会引领新一代的科技浪潮。加州大学圣巴巴拉分校 Galan Moody 实验室的Kamyar Parto博士认为,从所处的发展阶段来看,量子技术的今天,就像传统计算机的20世纪40年代。计算机发展之初,科研人员想要利用刚刚制造出的晶体管实现数字开关,但是到底基于何种结构的平台仍然是一个问题。因此,世界上不同的研究团队研发了不同的平台。不过最终都朝着一个方向发展——互补金属氧化物半导体(CMOS),在这之后,半导体技术迎来了爆发式的快速发展。今天的量子技术恰是如此,每个研究团队都有自己独特的想法和专门的应用,可谓百花齐放,目前还没有哪一种成为赢家。就量子计算而言,现在就有基于超导量子位、硅自旋量子位、静电自旋量子位和离子阱的量子计算机。Parto 预测,未来胜出的量子平台将是不同平台的组合,原因就在于虽然每种平台功能都很强大,但本身也不可避免的具有一定局限性。比如,自旋量子比特可以更轻松地存储信息并对其进行一些本地“操作”,却无法传输这些数据。但是如果采用量子光子学传输信息就变得非常容易。 量子比特作为量子技术的驱动器,与经典比特存在很大的不同。后者可以表示0和1两种不同的状态,就像是一个硬币的两面要么是0要么是1,并且经过逻辑门运算之后得出的结果是0和1的一种情况,绝对不会出现既是了0又是1的情况。但是量子比特可以既是0 又是1,两种状态同时存在。这种状态在量子力学中称作“量子叠加态”。 Parto 表示,在光子学领域,可以使单个光子处于既是0 又是1的状态。这是因为单个光子构成了所谓的双能级系统,意味着它可以存在于0、1或任何组合中,可以是20%的0 和80% 的1,也可以是70% 的0 和30%的1。实现该技术的挑战之处在于以高效率生成并收集单光子,比如使用波导将它们传输到芯片上。 Parto 解释说:“如果将单光子放入许多不同的波导中,且每个波导上有一千个单光子。人们可以编码光子如何沿着芯片上的波导传播,从而实现量子计算。”虽然使用波导在芯片上控制光子传输相对简单,但隔离单光子并不容易,而且想要建立一个快速高效地产生数十亿个光子的系统要困难得多。 虽然产生单光子的方法有很多,但 Parto及其同事通过某些仅有单个原子厚度的二维 (2D) 半导体材料中的缺陷来生成单光子。如果将激光照射到2D材料缺陷上,材料会发射单光子做出响应。材料中的缺陷表现为所谓的限速状态,由此可以一次一个的发出单光子。每隔3-5纳秒可能产生一个单光子,但具体的产生速度还需要进一步确定。 2D材料的一大优势是易于在特定的位置设计缺陷。而且由于其厚度非常小,可以覆盖到其他材料上,不受3D 晶体材料几何形状的限制,且易于集成。实验过程中,2D材料上的缺陷必须以极高的精度放置在波导中。Parto 指出,材料上有一个点缺陷可以产生光,他们需要将那个单光子进入波导。为了达到这个条件,研究人员尝试了多种方法,比如,将2D放在波导上,然后寻找现有的单个缺陷,但即使缺陷精确对齐并位于正确的位置,提取效率也也只20%-30%。原因在于单个缺陷只能以一种特定的速率发射,并且一些光以倾斜的角度发射,而不是直接沿着波导的路径发射。该设计的提取效率理论上最高仅为 40%,但制造用于量子信息应用的有效设备需要 99.99% 的提取效率。 Parto 表示,材料缺陷初发出的光朝着四面八方出射,但是只有照射到波导中才有用。研究人员有两种选择,如果将波导放置在缺陷的顶部,也许10%-15%的光会进入波导,但这远远不够。不过有一种称之为珀塞尔效应的物理现象——腔量子电动力学框架下的自发辐射增强,简单来说就是通过腔模的改变来调控量子体系自发辐射的速率。研究人员可以通过这种效应提高提取效率并将更多的光引导到波导中。在该研究中,他们采用微环形谐振器将光耦合进出波导。 如果微腔足够小,可以导致缺陷腔的自发辐射,并在微环谐振器中加速,变得更亮,从而增强提取效率。通过Purcell效应,该研究在室温下表现出高达46%的腔增强光谱耦合效率,超过了无腔波导-发射器耦合的理论极限(高达40%),比之前的工作提高了近1个数量级。 “团队对实验结果感到满意,因为在2D材料上实现单光子发射有助于解决其他材料在可扩展性和可制造性方面所面临的一些挑战。短期内,我们计划进一步探究其在量子通信中的不同应用;但从长远来看,我们的目标是进一步开发可用于量子计算的平台,” Parto讲到。如果想要做到这一点,该团队需要将提取效率提高到 99% 以上,而实现这一目标需要更高质量的氮化物谐振环。但是氮化硅薄膜并不一定是完全结晶,即使在原子水平上对其进行平滑处理,它的表面可能看起来像海绵一样仍然很粗糙,这样就会导致光散射,影响耦合效率。然而,如果材料本身不是完全结晶的,即使你试图在原子水平上对其进行平滑处理,表面仍然可能看起来很粗糙,像海绵一样,导致光线从它们身上散射开来。虽然有的研究团队在专门的公司购买高质量的氮化物,但Parto 计划在 UCSB 洁净室的等离子增强化学气相沉积炉中独立生长氮化物,以确保材料质量。
  • 《探索 | 基于强化学习算法的量子传感》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2023-04-12
    • 量子传感器是根据量子力学规律、利用量子效应设计的、用于执行对系统被测量进行变换的物理装置。作为量子技术最具潜力的应用之一,它旨在利用量子资源提高测量灵敏度。正如理论上量子计算机可以处理传统计算机无法解决的问题,量子传感器也可以将灵敏度和准确度提高到一个新的水平。其中,基于光学相位的传感受到科研工作者的广泛研究,对传感器件的大规模开发至关重要。 图1 集成光子量子传感器的自适应多相估计机器学习 但量子传感器如果想要保持高精度的测量水平,需要定期表征和校准。一般而言,这种校准是一项极其复杂的资源密集型工作。特别是用于评估多个参数的传感系统,因为需要花费大量的计算时间去测量并分析结果。 机器学习算法的出现为校准工作提供了一个强有力的工具,极大地降低了工作量。其中有一种称之为“强化学习”(RL)的算法,它是介于监督学习和非监督学习的另外一种学习方式。简单来说就是让计算机实现从一开始什么都不懂,脑袋里没有一点想法,通过不断地尝试,从错误中学习,最后找到规律,学会达到目的的方法。一个智能体采取行动给环境,环境给他新的奖励和新的状态,这个智能体根据他所受的奖励和新的状态,来采取下一步的行动形成一个闭环,这就是强化学习。直到最近才出现一些通过利用RL 算法优化量子问题的研究报道。但其中大多数工作仍依赖于描述系统的模型的先验知识。恰恰相反,理想的策略是一种完全无模型的方法,当代理的奖励不依赖于显式系统模型时,是有可能实现的。 图2 深度学习协议方案 基于此,意大利罗马大学物理系和光子学与纳米技术研究所(IFN-CRN)的研究团队成功开发了一种无模型方法,将应用范围扩大到自适应多相估计。该研究以“Deep reinforcement learning for quantum multiparameter estimation”为题发表在Advanced Photonics上。他们在高度可重构的集成光子平台上验证了无模型方法的有效性。实验中使用 RL 算法来优化多个参数评估,并将其与深度神经网络相结合,该网络在每次测量后更新贝叶斯后验概率分布。因为在任何步骤都不需要系统功能模型,该协议以完全黑盒的方式处理量子多参数传感器。重要的是,该团队证明了在资源有限的情况下通过他们的协议可以有效增强性能,并将其与非自适应策略进行比较,实现了更好的评估。