《苏州纳米所刘欣研究员、周扬帆博士等在非凸优化算法研究方面取得进展》

  • 来源专题:生物安全知识资源中心—领域情报网
  • 编译者: hujm
  • 发布时间:2023-02-24
  •   近年来,深度学习在材料科学领域中的原子模拟、材料成像、光谱分析等方向取得快速发展。与此同时,在芯片设计领域,为了满足边缘计算场景的算力需求,人工智能芯片也正在逐步完成与深度神经网络的高度适配。目前,由OpenAI公司推出的ChatGPT模型正在引领一次新的技术变革,该模型的本质就是一个超大规模的深度神经网络,属于深度学习框架。根据实践目标可以将深度学习划分为两个阶段:训练阶段和推理阶段。训练阶段是指通过一定的训练算法得到深度模型的参数;推理阶段就是将深度模型应用到实际场景中进行预测和分析,比如目前的ChatGPT模型就已经处于推理阶段。

      由于深度模型具有庞大的特征参数和高维的数据,比如ChatGPT模型包含1750亿个参数、BERT模型含有1亿个以上的参数,因此深度模型训练越来越成为一项极具挑战性的任务。通常来说,为了训练深度模型,可以通过最小化损失函数的值,将其转化为一个典型的非凸优化问题。然而,非凸优化问题中优化算法的收敛性往往是一个难以解决的问题。另外,因高维征向量带来的高昂计算成本问题也是制约深度模型训练任务顺利进行的另一个难题。

      中国科学院苏州纳米技术与纳米仿生研究所刘欣研究员、周扬帆等针对非凸优化问题中自适应优化算法的高维向量运算问题,提出了一种基于块坐标下降的自适应优化算法,简称为RAda(伪代码如图1所示)。该算法利用块坐标下降优化技术,在每轮迭代时随机的选取特征向量的一块坐标完成梯度计算及其他向量运算,从而大大减少每轮迭代的计算成本,减轻了深度模型训练对硬件设备的严重依赖。

      其中T表示迭代次数,p、η、σ均为参数,f表示损失函数。从上述结论可推论出RAda在非凸条件下可以收敛到一个具有δ精度的近似解。

      RAda算法的一个重要优势是每轮迭代的计算成本很低,不仅耗时少,而且对硬件算力的要求也很低。为此,实验部分对RAda算法的计算成本进行了对比验证。图2展示了RAda和其他对比算法在CIFAR-10和CIFAR-100数据集上训练损失随运行时间的变化情况。RAda达到最好精度的运行时间最少,说明其计算成本最低。

      综上,该研究工作从理论上证明了RAda在非凸情况下具有理论保证的收敛性,并且通过实验验证了该算法的计算成本比其他主流算法更低,这可以帮助完成很多场景下的深度模型训练任务,尤其是在边缘计算中端侧算力严重受限的情况下。因此,在边缘端人工智能芯片研发领域具有很大的应用前景。

      相关工作以Randomized block-coordinate adaptive algorithms for nonconvex optimization problems为题发表在人工智能顶级期刊Engineering Applications of Artificial Intelligence上。文章第一作者为中国科学院苏州纳米技术与纳米仿生研究所博士研究生周扬帆,通讯作者为刘欣研究员。该工作得到了苏州市外国专家计划等项目的资助。

  • 原文来源:http://www.sinano.cas.cn/news/kyjz/202302/t20230221_6681174.html;https://linkinghub.elsevier.com/retrieve/pii/S0952197623001525
相关报告
  • 《苏州纳米所康黎星等在碳纳米管限域合成一维磁性原子链研究方面取得新进展》

    • 来源专题:生物安全知识资源中心—领域情报网
    • 编译者:hujm
    • 发布时间:2023-10-12
    •   低维磁性材料由于其特殊的磁学性质,在基础理论发展和自旋电子器件应用均有重要研究价值,因而引起了研究人员的广泛兴趣。二维磁性材料研究在过去的十多年里取得了长足进展,如铬基卤化物范德瓦尔斯磁体 CrX3(X=I、Br、Cl)具有高度可调的磁性能,表现出明显的层数依赖。然而,这些奇妙的特性能否从二维延续到一维是一个极具吸引力和挑战性的问题。合成高质量一维磁性原子链是研究其物理特性的重要前提。然而,将二维宏观尺寸缩小到一维原子链,必然会导致卷曲和不稳定,这使得合成和表征非常具有挑战性。   针对上述问题,中国科学院苏州纳米所康黎星研究员等人采用碘辅助真空化学气相传输(I-VCVT)方法,以碳纳米管为模板,在其空腔内部高效率地制备了高质量一维CrCl3原子链,并在光谱研究中发现了一维原子链结构与碳纳米管之间的电荷转移。对该体系动态磁性的全面研究发现,一维CrCl3原子链在3 K左右存在自旋玻璃态冻结。该工作为控制合成一维磁性原子链提供了一个有效的策略,其丰富的磁学性质提供了物质基础充分研究其内在物理机制,也为未来开发基于一维磁性的自旋电子器件提供了基础。   使用化学气相传输中常用的碘作为气相传输剂,增强了前驱体从碳纳米管表面向内部的扩散行为,从而获得了结晶质量优异的高连续性一维CrCl3原子链。  大范围的STEM以及EDX元素图谱的扫描表明一维 CrCl3 原子链被高效及均匀地封装在 SWCNT 的空腔内,原子分辨的低压TEM以及模拟图揭示了被封装的一维CrCl3原子链的结构。   Raman表征发现了碳纳米管与封装物之间的主客体电荷转移,以及由此产生的G模式蓝移和RBM模式的抑制,XPS的C 1s峰向低能量移动佐证了主客体电荷转移。  相关工作以Efficient Synthesis of Highly Crystalline One-Dimensional CrCl3 Atomic Chains with a Spin Glass State为题发表于ACS Nano,中国科学院苏州纳米所博士生李云飞和博士后李阿蕾、李晶为论文共同第一作者。上海科技大学曹克诚研究员和中国科学院苏州纳米所康黎星研究员、李清文研究员为共同通讯作者。该研究获得了国家自然科学基金、江苏省青年基金和中国科学技术大学“雏鹰基金”等项目的支持。   
  • 《苏州纳米所在半导体SERS研究中取得新进展》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2017-12-20
    • 有一种元素,以单质分子形式构成了大气体积的 21% 、以化合物形式构成了地壳总质量的 48.6% ,这就是氧。因其活泼的化学性质及其较大的电负性,成就了自然界物种的多样性。自 1777 年由拉瓦锡发现以来,氧元素一直都是化学家的宠儿。如今在新兴的半导体 SERS 领域,它的重要性再一次被体现。   自上世纪 70 年代表面增强拉曼光谱( SERS )面世后,贵金属基底的引入将拉曼检测灵敏度提升了百万倍,克服了传统拉曼光谱与生俱来的信号微弱等缺点,使得拉曼检测在食品安全、环境监测、生命科学等领域得到广泛应用,并迅速成长为最为灵敏的表面物种现场谱学检测技术之一。然而,人们欣喜的同时却遗憾地发现, SERS 仅在金、银、铜等贵金属的粗糙表面才具有高活性,即需依赖贵金属表面电磁增强的 “ 热点 ” 效应,基底的选择十分有限;且实际应用中这种精细调制的材料结构易受环境因素干扰,稳定性差强人意。事实上,探索新型、高性能的非金属基底一直是 SERS 技术中最重要的研究方向之一。尤其近年来半导体化合物被证实具有 SERS 活性,其丰富的种类与化学组成引起人们极大的兴趣,但此类化合物作为 SERS 基底普遍较低的增强因子似乎成为难以突破的科研瓶颈。我们知道,基底材料所表现出的 SERS 性能来源于探针分子与其表面的相互作用,包括电磁增强( EM )与化学增强( CM )两种方式。通常认为金属材料中以电磁增强为主,而半导体化合物表面化学增强则起决定作用。正因为机制不同,半导体材料用作 SERS 基底的设计应遵循完全不同于现有的贵金属材料的研究理念。   最近,中国科学院苏州纳米所赵志刚研究员团队成功地发现了氧分子可以作为开启半导体化合物 SERS 性能宝藏的钥匙,即利用化合物化学组成可调的特点,巧妙地通过氧元素调控过渡金属化合物的化学计量组成或表面晶格氧浓度,来增强非(弱) SERS 活性材料表面物种的信号。   在此学术思想指导下,该研究团队首先选择自身富氧缺陷的 W 18 O 49 海胆状纳米粒子作为 SERS 基底,成功获得了高灵敏度和低探测极限的优异 SERS 性能。这种首次作为 SERS 基底的半导体材料对 R6G 分子的检测极限可低至 10 -7 M ,通过还原气氛( H 2 、 Ar )处理的方法进一步改变 W 18 O 49 的表面氧缺陷浓度,成功地将材料的 SERS 增强因子提升至 3.4 × 10 5 ,是现已报道的性能最为优秀的半导体 SERS 基底材料之一,并已接近无 “ 热点 ” 的贵金属材料。相比之下,化学计量比 WO 3 几乎没有 SERS 活性,这说明氧缺陷对于半导体氧化物的 SERS 性能有着至关重要的作用。   既然从晶格中拖出氧对材料 SERS 如此重要,那么反过来向晶格中插入氧又将如何?带着这个疑问,赵志刚研究员团队选择了硫化钼( MoS 2 )这种本身 SERS 性能微弱的硫族半导体材料,通过取代和氧化两种方式方便地实现其晶格中氧的插入。结果证实,适量的氧插入可使硫化钼的 SERS 活性提升 100,000 倍,但过量的氧掺杂会导致 SERS 活性大幅下降。此外,通过这种氧插入方法,硒化钨、硫化钨、硒化钼等多种化合物的 SERS 性能均可获得大幅增强,也就是说这种晶格氧调控的手段在提升半导体 SERS 性能方面颇具普适性潜力。   至此,晶格中的 “ 氧缺陷 ” 与 “ 插入氧 ” 对半导体 SERS 的增强作用已被统一,而理论计算结果更是指向了同一结论。该团队研究人员将化学增强的理论模型应用于半导体 - 有机分子体系,发现半导体材料晶格氧的增减可作为调控其能级结构的有效手段;其中 “ 氧缺陷 ” 会引入深能级作为电子跃迁的 “ 弹跳板 ” ,而 “ 插入氧 ” 将直接增加带边附近的电子态并伴随着禁带变窄;这些都将显著增加激光激发下半导体中电子跃迁的可能,并进一步通过振动耦合( Vibronic Coupling )作用于半导体 - 有机分子之间的电荷跃迁( Charge Transfer ),影响基底表面所吸附有机分子的极化张力,从而增强其拉曼光谱响应。   以上工作证实了恰当地调制半导体化合物中的晶格氧,可作为显著提升其 SERS 性能的一种有效手段,突破常规 SERS 技术中贵金属基底的局限性,进一步拓宽半导体化合物作为基底材料在 SERS 检测中的应用范畴。系列研究成果相继以 “Noble metal-comparable SERS enhancement from semiconducting metal oxides by making oxygen vacancies” 与 “Semiconductor SERS enhancement enabled by oxygen incorporation” 为题于 2015 年 7 月 17 日、 2017 年 12 月 8 日在 Nature Communications 在线发表。 ( DOI:10.1038/ncomms8800& DOI: 10.1038/s41467-017-02166-z)   研究工作得到国家自然科学基金 (51372266, 51572286, 21503266, 51772319, 51772320) 、 江苏省相关人才计划 (BK20160011) 、 中国科学院青年创新促进会 等的资助和支持。