《印度IBM系统开发实验室引领芯片与AI计算引擎创新》

  • 来源专题:新一代信息技术
  • 编译者: isticzz2022
  • 发布时间:2025-05-29
  •       近日,IBM印度系统开发实验室(ISDL)在芯片设计与人工智能计算引擎开发领域取得显著突破,正重塑全球半导体创新格局。位于班加罗尔的ISDL团队正在深度参与IBM前沿项目,包括专为AI优化的Telum II处理器和Spyre AI加速器研发。

          该实验室已超越传统支持中心角色,全面涉足半导体建模、架构设计、后硅验证及定制EDA工具开发等环节。ISDL团队负责IBM下一代处理器的全流程设计,从确定芯片功能、市场定位到产品落地实施,并支持IBM AIX、IBM i和Linux三大操作系统,其中大部分开发工作均在班加罗尔完成。

          ISDL的创新成果不仅体现在硬件层面,更着眼于构建完整的AI就绪系统,满足实时推理、低延迟任务及大规模企业应用需求。其研发的LinuxONE 5 Spyre AI加速器卡等产品,正推动印度在全球半导体与AI技术竞争中迈向新高度,标志着印度从技术追随者向创新引领者的转变。

  • 原文来源:https://www.eetimes.com/systems-development-lab-designs-ai-compute-engines-in-india/
相关报告
  • 《超算创新引领智能产业发展》

    • 来源专题:智能制造
    • 编译者:icad
    • 发布时间:2023-09-08
    • 8月24日至26日,2023全国高性能计算学术年会在山东青岛举行,探讨产业智能化和智能产业化背景下算力的创新与变革,展望新一代人工智能技术的发展趋势。   超级计算又称高性能计算,是通过并行计算提高运算速度,解决大规模科技计算和海量并发的数据处理问题。   当前,建设网络强国、数字中国、智慧社会是党中央、国务院的重大战略部署,推进人工智能、大数据产业发展都需要强大的计算能力。算力作为数字经济时代的生产力,已经成为经济社会高质量发展的重要支撑。    人工智能牵引算力部署   在人工智能的驱动下,算力需求持续增长,高性能计算技术与应用未来的发展和演进引发了广泛关注。   高效的计算能力是越来越复杂和庞大的人工智能应用的基础。反过来,人工智能技术的快速发展、基于大数据训练深度神经网络的需求又推动着算力的进步,新的计算软硬件基础设施不断推陈出新。   最新发布的《智算产业发展白皮书》显示,2022年我国新增算力设施中,智能算力占比已过半;预计2025年智算规模占比将超过85%;到2025年,算力核心产业规模将超过4.4万亿元,关联产业规模可达24万亿元。   当前,国家启动超算互联网部署将突破现有的单体超算中心运营模式,把全国众多的超算中心连接起来,构建一体化算力服务平台。通过超算互联网建设,将形成强大的国家算力底座,有效促进超算算力的一体化运营。   国家高性能计算机工程技术研究中心副主任曹振南指出,当前需要加强全国算力资源统筹协调,以应对算力设施分布不均衡、接口不统一、应用软件自主研发和推广不足等问题。已启动建设的超算互联网旨在连接产业生态中的算力供给、应用开发、运营服务、用户等各方能力和资源,并以互联网的思维运营超算中心,构建一体化超算算力网络和服务平台。曹振南表示,建设超算互联网的目标,不仅希望将超级计算机的设备连接在一起,更希望将所有供需方、整个超算生态链汇聚在一起,通过这个平台提供相应的服务,同时以互联网的思维运营超算,拓展思维与用户。   北京并行科技股份有限公司董事长陈健表示,算力网络是解决当前算力问题的最优模式。只要还有可用的超算算力,算力网络就能支撑用户完成计算任务。    加速突破关键核心技术   通用人工智能兴起直接导致了近期全国乃至全球高端超算算力极度紧缺的情况。而夯实软硬件基础设施,为超算算力的释放提供有力支撑成为当前最紧迫的任务。   我国在顶尖超算系统研制和超算系统部署数量方面处于国际领先行列,但在基础软件生态方面还有待完善。为此,中国工程院院士、清华大学计算机系教授郑纬民提出四点建议:加强超算基础软件研制,提升转化能力;研制统一并行编程模型和编译优化平台;建立国产超算HPDA系统软件栈;深入开展超算算力网络研究。   芯片是提高计算机系统性能的主要驱动力,而晶体管数量与工艺制程直接决定了超算系统的性能。变革当前芯片设计堆叠式技术路线,着眼自上而下构造式芯片设计的新范式,集成芯片为芯片算力突围开辟了新途径。中国工程院院士、中国科学院大学计算机科学与技术学院院长孙凝晖分析了当前计算系统在互联延迟、多核扩展等方面存在的瓶颈,介绍了通过自主工艺构造式设计高性能芯片的新途径。他表示:“当前,超级计算机的架构存在算力天花板,而集成芯片可突破众核芯片的IO带宽制约和多芯片之间的通信延迟制约,并且通过采用多级基板可进一步扩展众核规模,从而实现算力提升。”   据了解,中国科学院计算技术研究所与之江实验室合作开展了面向智能计算的大芯片设计工作,基于集成芯片构建高性能计算系统的思路,在多核扩展架构、多芯粒并行、供电散热扩散性等方面进行了深入研究与开发。   我国高度重视人工智能的发展,特别是在场景和应用创新方面,制定了诸多战略方针,旨在提升我国人工智能的创新能力。得益于AI的能力,高性能计算解决应用问题的能力得到进一步提升。随着HPC+AI融合应用的不断创新,高性能计算的应用开发、系统软件和体系结构正在发生变革。   华为计算产品线集群创新与仿真Lab主任杜云飞表示,华为围绕性能工程的基础软件、性能加速的中间件、应用的自动化优化,以及在新算法的混合精度、AI大模型和超大规模的存储及网络上,做了大量创新性的实践,使得大量的应用生态在超算系统上获得了更好的性能。   欧洲科学院外籍院士、俄罗斯自然科学院外籍院士、西安电子科技大学计算机科学与技术学部主任、人工智能研究院院长焦李成表示:“从最根本上来讲,ChatGPT也要回到核心,就是要回到数学的基础、数理逻辑和计算的能力,而所有这些正是高性能计算的核心技术所在。所以,高性能计算与人工智能是密切相关的。从这个意义上来讲,我们更应该把两者结合起来。对于大数据、互联网、人工智能、云计算来说,高性能计算如何在中间起到连接作用,值得我们去思考。”    多维创新孕育新机   目前,我国算力总规模位居全球第二,并且保持着30%左右的年增长率。预计在2023年,AI算力将首次超过通用算力。AI已成为算力增长的新引擎。如何跟上算力发展的步伐,凸显算力优势,实现算力资本、算力服务的协同互补成为亟须破解的问题。   近几年,我国算力综合供给水平快速提升,算力产业创新能力持续增强,算力赋能千行百业成效显著。从超算行业来看,超算已为汽车制造、气象海洋、基因测序、新药研发、芯片制造、石油勘探等众多行业提供了灵活弹性、快捷高效、安全可靠的算力支持。在AI的驱动下,超算行业未来仍有巨大潜力可挖,新的技术和应用亮点会层出不穷。   Al大模型训练对集群算力的需求正在高速增长,其中的高性能互联系统面临着前所未有的挑战和发展机遇。华为网络技术实验室主任刘冰洋介绍,面对高性能AI训练集群,如何提升其网络通信的性能。华为从两个方面去实现性能的提升:一是物理带宽和物理交换能量,这体现了硬核的实力;二是在硬件基础之上建立拓扑亲和计算的技术体系,通过网络和通信库框架之间的双向协同,充分发挥物理的带宽,从而实现通信效率的最优,并最终达到算效最优化的目标。   数字经济的发展依赖数字化、智能化与网络化的新经济基建开发。“发展数字经济要强调AI,更要强调群体性智能。”香港中文大学(深圳)校长黄铠表示,“面对大数据感知、机器学习认知、生成式AI等新技术、新应用,业界必须重视智能云认知与物联网感知的无缝结合,以及开源大模型在智慧城市、数字经济、远程医疗与全民健保等方面的落地应用,建立与时俱进的生态环境与工业体系,为数字经济的发展保驾护航。”   第十四届全国人大常委会委员、中国科学院院士吴立新指出,数字孪生作为透明海洋技术体系的重要组成部分,将有效深化人类对海洋系统的认知与变化预测,赋能海洋能源、海底矿产、海洋生物资源高效安全开发、海洋高端装备智能制造、海洋航运等产业发展。吴立新表示:“超算与人工智能深度融合的时代已经来临。它必将是一种新的科学范式,有重大的颠覆性创新。这一次,中国不仅要成为全球超算算力的领跑者之一,同时也希望能够成为全球超算应用的领跑者之一。”( 郑大海 ) (来源:中国工业报) 编辑:李芊诺 责编:张永杰 审核:陈雪辉 .
  • 《新思科技创始人:芯片开发的核心在于融合》

    • 来源专题:集成电路
    • 编译者:shenxiang
    • 发布时间:2019-11-19
    • 今天,ASPENCORE第二届“全球CEO峰会”在深圳举办,峰会邀请世界各地行业领袖和创新巨擘一起探讨新一轮技术冲击下最热门的技术话题,搜罗差异化的创新点,准确定义下一代电子产品。新思科技创始人Aart de Geus博士发表了《后摩尔时代,shift left抢占经济先机》的演讲。 以下是Aart de Geus演讲的具体内容: 我们看到硅和软件是两个最重要的因素,打开万物互联的世界,因为它真的改变了我们,就像四五十年前计算改变我们的生活一样,四五十年前我们也很难做到让幻灯片进行演讲的变化。作为演讲者我就要学习不断地适应这个变化。 我们人类的知识对技术的发展也是非常重要的。我们知道,智能的事情其实不是新的东西,我们可以几百年前放到一些聪明智慧的东西,比如在很多年前,几十万年前我们就可以发现,如果回到几千年前我们就出现了这些农用的工具,再回到之前,还有像我们这些农具、马、车轮等等,我们就来到了现在的年代。 我们可以看到,在现代的年代,在后面近一个时代,摩尔定律还有数字电子,还有人工智能,让所有的事情都发生了改变。他们都有着同样的特点,就是他们给我们一种非常惊奇的事物出现,然后就得到我们一个工程学的应用。正如我们所看到的,我想给大家看的幻灯片没有及时放出来,大家看到,这是一个闭环,然后通过这样一种发展,进入了我们的科技经济的反馈,最后经过融合,回到科技行业,然后最终形成一种指数级的影响。 之前我们也可以看到,它能够应用到很多不同的领域,比如说能够应用到我们生活里面的一些实际方面、生物的方面、生态的方面,还有我们的一些智慧知识方面,还有能够应用到我们的社会方面,还有不同方面的中间领域。最重要的在里面我们可以看到,这是我们的印刷机的发展,有了印刷的发展,给我们人类的技术发展有很大影响。我们首先有字母的产生,然后有了金属的活字,墨水、纸张,后来有的螺旋压机,当然在中国很久之前就有印刷技术的出现了。但在欧洲,在公元前六七百年,我们中国就有了雕版印刷,在德国公元后1440年就有了德国的活版印刷。五百年之后,我们也看到了另外一种印刷技术,我们出现了一种印刷的技术,就是布尔字母和逻辑库,然后又出现了平版印刷,电子设计和自动化产生的一种平板的晶体管,所以我们称之为一个数字年代。所有这些集成到一个芯片里面,改变了我们的生活。 我们整个指数级是一个非常特别的,比如说像猛兽般一样发展的情况,因为它发展得非常快,它发展那么快,就代表着我们很难回到之前的一些步骤里面。我从大家其中的一些项目里面看实际情况,在项目里面会不会有延误的情况出现呢,还是经理是不是疯了,他为什么这样说你,但就算他疯了,我们可能还是会有点延误,因为我们知道,一开始的时候我们有很多不确定的东西,然后我们这些步骤逐渐地得到收敛,而我们要不断地去解决中间的一些问题,我们要解决在我们整个过程里面有令人惊奇的东西出现,我们要不断地解决这些让人吃惊的问题。 在这里我们要解决几个问题:第一个就是结果的质量,还有实现者结果的时间,还有整个实现结果的成本。当然我们希望有更好的结果的质量,能够更快地实现这个结果,还有用更低的成本实现这个结果。 非常缓慢的来解决这些问题,然后你把它整个的曲线向左侧推移,就变成这样一个过程,已经在过去的50年的时间里,我们都在这样做了,我们也在不断地验证这些观点。我们之前提到的EDA就是电子设计自动化,在过去50年的时间里,我们在做的事情,我们把它如果输入到电脑中,我们就能够进行一些相关的抓取信息,然后建立模型,然后最后模拟进行分析,进行优化,然后如果你进行优化之后,就能够进行自动化的操作,最后进行不断地重复利用,产生IP。我们看到,很多主要的问题,我们看到有很多的推动力,非常有趣的是,我们可以说在这个领域有非常重大的关注和努力,我们进行设计电脑,我们就是用这样的电脑程序来建立最先进的芯片。 经常来看,可以说成功仅仅是一部分我们努力所取得的成果,而不是全部,可能有的时候经过很多努力也没有得到一个好的结果,比如说0结果,那就是合作的重要性,我们共同的突然,共同协作,你看到这一部分,我们不断地在向前推动,我们看到AI人工智能的发展,我们抓取了数据。你把它在网络中建模,然后学习,然后进行解码,然后最后进行有限的行动,最后把它深化成一个自动的行为,这也就是可以被我们未来所用到这些东西。 你可以看到,经过这样一些模拟建模,我们就通过建模,跟机器学习不断地进行发展,我们就能够了解和预估未来可能造成的失败,来进行我们前面所提到的科技经济的向左迁移的这一部分。就是这样的一个演化,它就是一个复杂的科技经济,我们把技术由原来的规模复杂性转化成系统的复杂性。如果我们看这个系统的复杂,可以说摩尔定律是最重要的,需要我们不断地设计我们最新的半导体和显屏。可以说随着半导体和芯片的不断发展,我们看到很多电子产品不断地进行连通,然后进行协调,最后变成不断地发展。你可以看到供应链,供应链不断地发展,更加独立性,互相之间进行联动,越来越发展。在汽车行业,可以说汽车行车在发生很大的改变。汽车工业不仅仅是一个系统的复杂性,而且还要面对很多的问题挑战,比如说安全性等等。 现在我们在建设越来越多的未来的汽车,不仅仅是越来越方便,越来越快捷,而且是越来越安全,这就是我们未来的一个方向。可以看到这个汽车里面,基本上包含四到五个关键性的电子系统,你可以看到,首先要建立一些汽车的基本东西,然后建立网络,在这所有的过程中,我们都需要有很多的东西,都需要芯片,这都需要花费时间。我们虚拟的模拟是什么呢?不仅仅是要使用这个芯片,而且要建立一个系统跟架构,然后建立一些模型,然后当你在这些方面做了之后,你把它发过去,他们就不断地进行验证,不管软件硬件都要进行验证,然后才能进行应用。因此我们有这样的一个虚拟板和实物板,我们就要在这个过程中不断地确认和了解,是否达到有效性和安全性。这也仅仅是一个例子,来说明一些我们刚才提到的内容,就是原型设计和样机研究。对于人类最重要的就是来预测气侯变化,而且要预测未来气侯变暖对全球的影响。可以说这个问题是非常巨大的,涵盖的内容非常地多,它有很多方面,在很多方面都造成相互的影响。如果我们看到系统的复杂性,你可以看到我们在1970年前,我们之间的模型是非常简单的,而到了1980年代,就有一个发展,然后你可以看到,随着时间的推移,气侯的模型越来越复杂。你可以看到,第四步就是越来越复杂了。 我们在这个预测方面,非常地好,的确让我们非常地奇怪,我们可以看到,很多细节的一些模型,你可以很好地预测出未来的发展趋势,然后我们看到这些结果,我当时看到这些结果的分析并不复杂。你可以看到,这个全球范围内的耦合器或模型,你可以看到在60年代、70年代、80年代、90年代,随着时间的发展,数据的分析越来越复杂,而且越来越精确。你可以看到,2017年的还有最近的情况,气侯预测与测量。你可以看到它可以很好地看到一些相关的指标,来预测一些气侯性的世界性的特殊的事件发展。如果你能够看到这些东西的话,你能够看到这些分析,就能够告诉我们,预测和测量能够让我们很好地了解到气侯变化,还有全球变暖对我们全球气候的问题,如果我们不把这些问题分析清楚的话,我们就没有办法解决这个问题。 我为什么要告诉大家呢?可以说通过分析这些东西,这些分析家是世界上最聪明,在这个行业最聪明的人士,他们在这些分析中能够分析很多数据,能够帮助到我们,不仅仅能够推动我们技术的发展,我们也能够了解到我们现在的产能是怎么样消耗能源的。如果我们进行一些简单的分析,一个相机的能源消耗,你可以可到一个普通的相机,消耗的能量是发电厂的产能,这里面仅仅是一个公式,你可以看到这个研究,你可以看到很多的数据,很多的能源,你可以进行很多的运算,都要涵盖在这里面。 我们可以看到,里面有很多的一些计算,结果就是机器学习,机器学习实际上会消耗很多的能量,因此我们就需要设计更好的东西,就是消耗的能量更低。我们不断地发展我们新的技术,不断地促进这方面的发现,我们可以很好地应用。你可以看到很多东西都是起源于算法的,当我们谈到融合的时候,我们可不可以把我们现有的一些技术能够把它整合到一起,能够把他们整合到同样的算法里面,能够提高它的有效性。 我给大家一个例子,在很多年前,我们努力建立一个计算机,很多计算机涵盖很多处理器和存储器,怎么融合呢,非常简单有效,就是进行架构的创新,这是关键要素所在。 这是至关重要,我们就要把这些进行创新,把他们融合在一起,在设计芯片的时候,我们也要有类似的问题需要回答。我们需要有很多的步骤采取。比如说架构,还有模拟,还有整合,还有测试,还有时间,还有功率,还有进行整合等等的一些内容,最后达成整个的过程。刚才我们提到了缓存。我们可以看到,这是我们1995年以来,在计算机设计方面等等一些方面所取得的很多的进展和融合。 对我们来说,我们能不能在这两方达成融合,就是通过团队合作,答案是对的,我们可以的。我们必须要进行这方面的一些工作,我们必须一步步地来,做重要的合成,然后并且根据它的路径和路由器等等进行整合,最后我们把它整合在一起,并且仔细地看看里面的算法,并且通过前面的一些架构的创新,来达成融合编译器。我们在这些工作做了之后,我们就知道了,我们能够做到哪些东西,我们把它们能够融合起来,能够不断地增加设计步骤的速度,可以说能增加100%,也就是原来的两倍多,并且能够使得它的响应时间更快,它使用的功率更加小,并且占据的产品空间越来越小,就是产品越来越精巧。而且我们也在这方面加进了很多人工智能的步骤,来达成更好的最后结果。 当然,最后就回到了我们经常谈到的一个课题,就是人工智能AI,它在我们人生的方方面面都离不开人工智能,这所有的东西都先要开始谈一下融合,我们实际上最伟大的一个融合机器就是我们的大脑,首先就是逻辑思维,还有进行分析。也还有一种学习的模式,能够让我们不断地学习新的东西,人脑是人类出现最伟大一个合成融合的机器。如果我们进行比较的话,如果我们把人工智能与人的大脑自然智能进行比较的话,我们就能够看到这样一个发展过程,从1997年相关的围棋、象棋,还有2015年的一些游戏等等东西。有一天它发展到一定阶段,可能把你们的母亲都可以替代掉。但我们可以想一下,我们的妈妈是一个只需要使用12W功率非常聪明的一个人。所以我们在人的大脑里,有一个非常非常深入的人工智能,要很多年才可以真的达到那种高的水平。我们可以看到,在其中有多种能力去驱动人工智能的发展,比如包括机器学习,还有通过物联网,让我们得到很多的大数据,我们经济的利益也让我们能够进入到垂直的市场里面,每一个垂直的市场都能让我们的AI有非常迅猛的发展。 这幅图的比例是有一点点不太对的,我跟你说一下,我们对我们的半导体是非常自豪的,但我们看一下我们今天的半导体,其实整个市场量只有5000亿的规模,我们看整个的软件我们还不知道有多少万亿,但我们在之前看整个GDP,有85万亿这么多,所以我们怎样把这个半导体在里面的贡献额更加地提高呢?因为现在只有5000亿这么小。我们可以看到,在整个解决方案里面,市场规模可以达到10万亿那么多。所以通过我们的摩尔法则的拉动,能够让我们整个半导体市场的规模变得更高。所以通过这种拉动,能够让我们的科技和经济有非常大的发展。 我们可以想一下,整个的规模有不断的发展,然后可能成本会越来越高,但整体通过这样一种半导体芯片体积的压缩变小,还有不断的变薄。我们还可以把它们堆叠在一块,拉在一块,我们可以看到,在这样一个小的芯片里面,里面可以包含12000亿个芯片组,晶体管等等。然后在里面有非常多层,可以把这么多的芯片提供到我们不同的运营商他们使用。 我最推荐的就是第三样,我们要让芯片变得更加专业化,用到一些具体的行业和领域里面,然后再从中建立全新的架构。在中国很多公司正在构建下一代AI的架构,他们每个公司都说,我们在做的是最好的,前所未有最好的一些芯片。当然在这里我们也面临一些挑战,我们可以看其中一个就是要用的能耗,比如损耗的能耗,动态的电能,还有大多数的能量,我们所需要的都是热能,还有一些人类所需要用的能量。在里面安全也对我们整体的流程产生一个影响,也对我们的安全还有我们所期待的可靠性也会有影响。当然,最后也会考虑到我们的隐私。 所以这些目前都是在软件领域去解决的,软件其实整个的发展流程跟整个硬件的流程其实是一样的,我们一开始的时候,就想要去完成这个软件,在我们去完成这个软件之后,我们很快就会做完这样一个过程,因为我们有一些开源的代码,我们还需要去检查它的安全性,如果我们找到问题就要解决这个问题,如果我们找到更多的问题,我们要不断地去解决它。我们会用很多的开源,可能会让我们提高更多的效率,但开源也会产生数据泄露的问题,所以未来应该怎样解决这些问题呢?我们应该在整个流程过程的最前端就开始介入。当我们再去开发的时候,我们在不断地开发过程中,要把这些问题都解决掉。有时候通过一些电子的学习,比如可以开发一些软件测试,去发现问题,然后进行直接验证,我们也要验证所有的开源,没有任何问题,然后我们也要得到一些许可,去遵守这些许可。所以这就是我们所说的向左推移的流程。 所以在我的演讲里面说了很多的主题,由于我的控制器不太灵光,让大家觉得有点卡顿,但我希望在我这里在分享的概念,智能互联关系着很多方面,它关系到我们整个指数级的发展,也关系到每个领域里面都要做向左推移的控制和管理。我们也看到了,调整我们有关结果控制的,比如说包括质量、时间和成本的调整。我们也可以看到,我们面临了很多挑战和验证的问题,我们也要打造很多的原型和样本。我们要处理很多我们需要用到的这些能量,还有我们要去处理安全、隐私、可靠性等等问题。对我来说最有趣的一个解决方案就是,这让我们有机会去改变我们过去很多事情的一些架构,为了要能够做到这一点,我们这个图是最重要的,在这个图片里面,它不仅仅是有关我们整个努力的结果,而是有关我们整个产品本来的概念。所以通过我们这样一种协作,协作就是整体的核心。 我们已经来到中国25年了,我们希望能够跟中国很多初创的企业合作。