现代人工智能(AI)依靠中央云来处理边缘设备生成的数据,但这种云边缘分离模型并不节能。开发具有训练和推理合一(training-and-inference-in-one, TIIO)架构的原位机器学习硬件是边缘智能的最终目标。TIIO提供了数据安全性、实时处理和带宽的优势,但由于边缘资源有限,它需要极高的能源和面积效率。最近,基于非易失性存储器(NVM)的内存计算已成为边缘智能有前途的解决方案。然而,使用单个NVM技术同时执行训练和推理一直具有挑战性,因为大多数NVM缺乏较大的内存可调性属性,从而阻止了同时满足训练和推理要求的通用内存计算架构。
南京大学和清华大学合作报道了一种基于铁电场效应晶体管和原子薄MoS2的双工器件结构通道,并实现用于原位学习的通用内存计算架构[1]。通过利用铁电能量的可调性,双工构建块表现出整体出色的性能,耐久性(>1013)、保持力(>10年)、速度(4.8 ns)和能耗(22.7 fJ?bit–1?μm–2)。
研究团队使用双晶体管一双工铁电场效应晶体管单元阵列(two-transistors-one-duplex ferroelectric field-effect transistor cells)实现了硬件神经网络,并在原位训练权重的非线性定位任务中实现99.86%的准确率。仿真结果表明,在显著提高能效的情况下,所提出的器件架构可以达到与图形处理单元相同的性能水平。该器件核心还可以通过三维异构集成与硅电路相结合,为通用边缘智能提供硬件解决方案。
[1] Hongkai Ning, Zhihao Yu, Qingtian Zhang, et al. An in-memory
computing architecture based on a duplex two-dimensional material structure for
in situ machine learning [J]. Nature Nanotechnology, 2023, https://www.nature.com/articles/s41565-023-01343-0