《清华大学在智能光芯片领域取得重大进展》

  • 来源专题:光电信息技术
  • 编译者: 王靖娴
  • 发布时间:2024-08-11
  • 【内容概述】据光行天下8月10日报道,近日,清华大学电子系方璐教授课题组与自动化系戴琼海教授课题组在智能光芯片领域取得重大进展。他们首创全前向智能光计算训练架构,研制出“太极-Ⅱ”光芯片,实现了大规模神经网络的原位光训练,为人工智能(AI)大模型探索了光训练的新路径。相关成果以《Fully forward mode training for optical neural networks》为题,发表在最新一期《自然》国际学术期刊上。

       现有光神经网络的训练严重依赖GPU离线建模,并要求高度匹配的前向-反向传播模型。这对光计算系统的精准对齐提出苛刻要求,致使梯度计算难、训练规模小,禁锢了光计算的优势。 据介绍,“太极-Ⅱ”的面世,填补了智能光计算在大规模神经网络训练这一核心领域的空白。除了加速AI模型训练外,其还在高性能智能成像、高效解析拓扑光子系统等方面表现出卓越性能,为人工智能大模型、通用人工智能、复杂智能系统的高效精准训练开辟了新路径。 

    (文献详细内容,请看下一篇编译)

  • 原文来源:http://mp.weixin.qq.com/s?__biz=MjM5MjIxNzI4Mg==&mid=2654042475&idx=1&sn=3fe73896a835e8d6542749f7c01bca75&chksm=bd6c78c68a1bf1d0c0d43ca114ea383484f5852583f43fad002559d00e56a7a6590f8a8b68e5#rd
相关报告
  • 《清华大学研究团队在晶圆级芯片领域取得重要进展》

    • 来源专题:集成电路与量子信息
    • 发布时间:2025-07-22
    • 晶圆级芯片(Wafer-Scale Chip)是一种颠覆传统计算和半导体制造模式的前沿技术,其优势在于能够以更少的节点数目实现更高的集群扩展线性度和性能,同时具有更高的互连密度、更短的互连距离和更大的集成密度,单机柜算力密度可达现有超节点方案的两倍以上。  清华大学集成电路学院尹首一、胡杨研究团队在晶圆级芯片领域取得重要突破,三项研究成果在2025年国际计算机体系结构研讨会(ISCA)上发表。自2020年起,尹首一教授瞄准超高性能大模型训练与推理场景,探索晶圆级芯片技术,提出了“计算架构”与“集成架构”两大核心设计方法。本次ISCA的三项成果分别研究计算架构问题、集成架构问题与大模型推理任务映射问题,构建了“计算架构-集成架构-编译映射”协同设计优化方法,获得学术界与工业界广泛认可。  该团队联合清华系芯片企业研发了可重构算力网格芯粒,并制造出国内首台基于可重构AI芯粒的12寸晶圆级芯片验证样机,证明了晶圆级集成方式在次世代工艺条件下的可行性,为解决国内芯片“卡脖子”难题提供了技术路线。
  • 《我国科学家取得智能光芯片研究新进展》

    • 来源专题:能源情报网监测服务平台
    • 编译者:郭楷模
    • 发布时间:2024-08-12
    • 清华大学电子工程系方璐教授课题组和自动化系戴琼海院士课题组日前实现了光计算系统大规模神经网络的高效精准训练。该研究成果以“光神经网络全前向训练”为题,于北京时间8月7日晚在线发表于《自然》期刊。 人工智能大模型的迅猛发展与广泛应用,使得算力成为重大的战略抓手与基础设施。长期以来电子芯片的算力增长支撑着AI模型规模的不断发展,然而其高能耗亦带来了前所未有的能源挑战,新兴计算范式的建立与发展迫在眉睫。以光为计算媒介,以光的可控传播构建计算模型,光计算以其高算力低能耗特性打开了智能计算的新赛道,在后摩尔时代展现出巨大的潜力。 训练和推理是AI大模型核心能力的两大基石,缺一不可。相较于推理而言,模型训练对算力更为急需,然而电训练架构要求前向-反向传播模型高度匹配,这对光计算物理系统的精准对齐提出了苛刻的要求,致使梯度计算难、离线建模慢、映射误差大,极大地禁锢了光训练的规模与效率。 清华大学电子工程系方璐教授课题组、自动化系戴琼海教授课题组构建了光子传播对称性模型,摒弃了电训练反向传播范式,首创了全前向智能光计算训练架构,研制了通用光训练芯片“太极-II”,摆脱了对离线训练的依赖,支撑智能系统的高效精准光训练。“太极-II”的面世,填补了智能光计算在大规模训练这一核心拼图的空白。