本文内容转载自“ AI Energy”微信公众号。原文链接: https://mp.weixin.qq.com/s/A8t1cJLwc4WsqD8Fz-cSSQ
2023年11月4日,北京国家信息科学与技术研究中心,清华大学和清华大学深圳国际研究生院的研究人员在Nature Communications杂志发表了一篇题为Training large-scale optoelectronic neural networks with dual-neuron optical-artificial learning的论文。
光电神经网络(Optoelectronic neural networks,ONN)在并行化、功率效率和速度方面具有潜力,是人工智能计算领域的一个前景广阔的途径。衍射神经网络通过训练有素的光学元件传播编码光来处理信息,因而备受关注。然而,由于光学衍射建模的计算和内存成本,大规模衍射网络的训练面临挑战。
该研究提出了双神经元光学人工学习架构 DANTE。光学神经元为光学衍射建模,而人工神经元则用轻量级函数来近似密集的光学衍射计算。DANTE 还通过迭代全局人工学习步骤和局部光学学习步骤来提高收敛性。在模拟实验中,DANTE 成功地在 ImageNet 上训练了 1.5 亿个神经元的大规模 ONNs,这在以前是无法实现的,与单神经元学习相比,DANTE 在 CIFAR-10 基准上显著加快了训练速度。在物理实验中,本该研究开发了基于DANTE的双层ONN系统,它能有效地提取特征,提高自然图像的分类能力。