《东芝公司提出多芯片架构有望在复杂的金融交易和机器人技术中创造改变游戏规则的转变》

  • 来源专题:后摩尔
  • 编译者: shenxiang
  • 发布时间:2021-03-17
  • 在解决大规模优化问题方面处于行业领先地位的东芝公司(Toshiba Corporation)3月12日宣布了一项将硬件限制降至最低的横向扩展技术,这是该公司优化计算机模拟分岔机(Simulation branch Machine,SBM)的一个发展,它支持计算速度和规模的持续提高。东芝预计,对于需要大规模、高速和低延迟的现实世界问题,例如涉及大量股票的同时金融交易,以及多个机器人的复杂控制,新的SBM将成为游戏规则的改变者。研究结果发表在3月1日的《自然电子》杂志上。

    在金融、物流和通信等不同的工业部门,速度和规模是取得成功的关键,所有这些部门都必须在尽可能短的时间内处理大量问题并做出复杂的决策。为了给这些和其他业务带来更高的效率,东芝通过开发高速、高精度的算法和相应的实用计算机解决方案来解决组合优化问题。该公司最近宣布了第二代模拟分岔算法,该算法通过一个现场可编程门阵列(FPGA)在经典计算机上实现,在获得各种组合优化问题的高速最优解方面超过了量子计算机。

    东芝继续通过在计算机中安装更多的FPGA来追求SBM更好的性能,这种方法在计算机体系结构中称为横向扩展,并成功地演示了全球第一个针对所有连接类型的组合优化问题的计算速度和问题大小同时横向扩展*4*1。该技术的核心是模拟分岔算法的分区版本,它使多个FPGA能够相互交换变量信息,并触发一种自主同步机制,将通信开销最小化到不影响整体性能的程度。

    试验表明,一个由8个FPGA组成的SBM(图3a)的计算吞吐量是单个FPGA SBM的5.4倍,解决的问题是单个FPGA SBM的16倍;64个FPGA SBM的仿真结果表明,计算速度和FPGA数量之间的关系是完全线性的,表明该技术可以继续扩大规模,取得同样的效果。

    8 FPGA SBM的求解速度也是模拟退火(SA)的828倍,模拟退火是一种广泛使用的优化技术,表明SBM比SA更有效地利用计算资源。

    快速的计算速度、大的计算规模和提供解决方案的低延迟是新的SBM能够为企业提供的关键价值。东芝公司希望这项新技术将把金融科技和物流提升到一个新的水平,使金融业能够同时交易更多的股票以及机器人在零时间滞后计算下能在物流业表现更好。

    论文链接:K. Tatsumura et al., Scaling-out Ising machine using a multi-chip architecture for simulated bifurcation, Nature Electronics 4, (2021).

    https://www.nature.com/articles/s41928-021-00546-4

相关报告
  • 《新思科技创始人:芯片开发的核心在于融合》

    • 来源专题:集成电路
    • 编译者:shenxiang
    • 发布时间:2019-11-19
    • 今天,ASPENCORE第二届“全球CEO峰会”在深圳举办,峰会邀请世界各地行业领袖和创新巨擘一起探讨新一轮技术冲击下最热门的技术话题,搜罗差异化的创新点,准确定义下一代电子产品。新思科技创始人Aart de Geus博士发表了《后摩尔时代,shift left抢占经济先机》的演讲。 以下是Aart de Geus演讲的具体内容: 我们看到硅和软件是两个最重要的因素,打开万物互联的世界,因为它真的改变了我们,就像四五十年前计算改变我们的生活一样,四五十年前我们也很难做到让幻灯片进行演讲的变化。作为演讲者我就要学习不断地适应这个变化。 我们人类的知识对技术的发展也是非常重要的。我们知道,智能的事情其实不是新的东西,我们可以几百年前放到一些聪明智慧的东西,比如在很多年前,几十万年前我们就可以发现,如果回到几千年前我们就出现了这些农用的工具,再回到之前,还有像我们这些农具、马、车轮等等,我们就来到了现在的年代。 我们可以看到,在现代的年代,在后面近一个时代,摩尔定律还有数字电子,还有人工智能,让所有的事情都发生了改变。他们都有着同样的特点,就是他们给我们一种非常惊奇的事物出现,然后就得到我们一个工程学的应用。正如我们所看到的,我想给大家看的幻灯片没有及时放出来,大家看到,这是一个闭环,然后通过这样一种发展,进入了我们的科技经济的反馈,最后经过融合,回到科技行业,然后最终形成一种指数级的影响。 之前我们也可以看到,它能够应用到很多不同的领域,比如说能够应用到我们生活里面的一些实际方面、生物的方面、生态的方面,还有我们的一些智慧知识方面,还有能够应用到我们的社会方面,还有不同方面的中间领域。最重要的在里面我们可以看到,这是我们的印刷机的发展,有了印刷的发展,给我们人类的技术发展有很大影响。我们首先有字母的产生,然后有了金属的活字,墨水、纸张,后来有的螺旋压机,当然在中国很久之前就有印刷技术的出现了。但在欧洲,在公元前六七百年,我们中国就有了雕版印刷,在德国公元后1440年就有了德国的活版印刷。五百年之后,我们也看到了另外一种印刷技术,我们出现了一种印刷的技术,就是布尔字母和逻辑库,然后又出现了平版印刷,电子设计和自动化产生的一种平板的晶体管,所以我们称之为一个数字年代。所有这些集成到一个芯片里面,改变了我们的生活。 我们整个指数级是一个非常特别的,比如说像猛兽般一样发展的情况,因为它发展得非常快,它发展那么快,就代表着我们很难回到之前的一些步骤里面。我从大家其中的一些项目里面看实际情况,在项目里面会不会有延误的情况出现呢,还是经理是不是疯了,他为什么这样说你,但就算他疯了,我们可能还是会有点延误,因为我们知道,一开始的时候我们有很多不确定的东西,然后我们这些步骤逐渐地得到收敛,而我们要不断地去解决中间的一些问题,我们要解决在我们整个过程里面有令人惊奇的东西出现,我们要不断地解决这些让人吃惊的问题。 在这里我们要解决几个问题:第一个就是结果的质量,还有实现者结果的时间,还有整个实现结果的成本。当然我们希望有更好的结果的质量,能够更快地实现这个结果,还有用更低的成本实现这个结果。 非常缓慢的来解决这些问题,然后你把它整个的曲线向左侧推移,就变成这样一个过程,已经在过去的50年的时间里,我们都在这样做了,我们也在不断地验证这些观点。我们之前提到的EDA就是电子设计自动化,在过去50年的时间里,我们在做的事情,我们把它如果输入到电脑中,我们就能够进行一些相关的抓取信息,然后建立模型,然后最后模拟进行分析,进行优化,然后如果你进行优化之后,就能够进行自动化的操作,最后进行不断地重复利用,产生IP。我们看到,很多主要的问题,我们看到有很多的推动力,非常有趣的是,我们可以说在这个领域有非常重大的关注和努力,我们进行设计电脑,我们就是用这样的电脑程序来建立最先进的芯片。 经常来看,可以说成功仅仅是一部分我们努力所取得的成果,而不是全部,可能有的时候经过很多努力也没有得到一个好的结果,比如说0结果,那就是合作的重要性,我们共同的突然,共同协作,你看到这一部分,我们不断地在向前推动,我们看到AI人工智能的发展,我们抓取了数据。你把它在网络中建模,然后学习,然后进行解码,然后最后进行有限的行动,最后把它深化成一个自动的行为,这也就是可以被我们未来所用到这些东西。 你可以看到,经过这样一些模拟建模,我们就通过建模,跟机器学习不断地进行发展,我们就能够了解和预估未来可能造成的失败,来进行我们前面所提到的科技经济的向左迁移的这一部分。就是这样的一个演化,它就是一个复杂的科技经济,我们把技术由原来的规模复杂性转化成系统的复杂性。如果我们看这个系统的复杂,可以说摩尔定律是最重要的,需要我们不断地设计我们最新的半导体和显屏。可以说随着半导体和芯片的不断发展,我们看到很多电子产品不断地进行连通,然后进行协调,最后变成不断地发展。你可以看到供应链,供应链不断地发展,更加独立性,互相之间进行联动,越来越发展。在汽车行业,可以说汽车行车在发生很大的改变。汽车工业不仅仅是一个系统的复杂性,而且还要面对很多的问题挑战,比如说安全性等等。 现在我们在建设越来越多的未来的汽车,不仅仅是越来越方便,越来越快捷,而且是越来越安全,这就是我们未来的一个方向。可以看到这个汽车里面,基本上包含四到五个关键性的电子系统,你可以看到,首先要建立一些汽车的基本东西,然后建立网络,在这所有的过程中,我们都需要有很多的东西,都需要芯片,这都需要花费时间。我们虚拟的模拟是什么呢?不仅仅是要使用这个芯片,而且要建立一个系统跟架构,然后建立一些模型,然后当你在这些方面做了之后,你把它发过去,他们就不断地进行验证,不管软件硬件都要进行验证,然后才能进行应用。因此我们有这样的一个虚拟板和实物板,我们就要在这个过程中不断地确认和了解,是否达到有效性和安全性。这也仅仅是一个例子,来说明一些我们刚才提到的内容,就是原型设计和样机研究。对于人类最重要的就是来预测气侯变化,而且要预测未来气侯变暖对全球的影响。可以说这个问题是非常巨大的,涵盖的内容非常地多,它有很多方面,在很多方面都造成相互的影响。如果我们看到系统的复杂性,你可以看到我们在1970年前,我们之间的模型是非常简单的,而到了1980年代,就有一个发展,然后你可以看到,随着时间的推移,气侯的模型越来越复杂。你可以看到,第四步就是越来越复杂了。 我们在这个预测方面,非常地好,的确让我们非常地奇怪,我们可以看到,很多细节的一些模型,你可以很好地预测出未来的发展趋势,然后我们看到这些结果,我当时看到这些结果的分析并不复杂。你可以看到,这个全球范围内的耦合器或模型,你可以看到在60年代、70年代、80年代、90年代,随着时间的发展,数据的分析越来越复杂,而且越来越精确。你可以看到,2017年的还有最近的情况,气侯预测与测量。你可以看到它可以很好地看到一些相关的指标,来预测一些气侯性的世界性的特殊的事件发展。如果你能够看到这些东西的话,你能够看到这些分析,就能够告诉我们,预测和测量能够让我们很好地了解到气侯变化,还有全球变暖对我们全球气候的问题,如果我们不把这些问题分析清楚的话,我们就没有办法解决这个问题。 我为什么要告诉大家呢?可以说通过分析这些东西,这些分析家是世界上最聪明,在这个行业最聪明的人士,他们在这些分析中能够分析很多数据,能够帮助到我们,不仅仅能够推动我们技术的发展,我们也能够了解到我们现在的产能是怎么样消耗能源的。如果我们进行一些简单的分析,一个相机的能源消耗,你可以可到一个普通的相机,消耗的能量是发电厂的产能,这里面仅仅是一个公式,你可以看到这个研究,你可以看到很多的数据,很多的能源,你可以进行很多的运算,都要涵盖在这里面。 我们可以看到,里面有很多的一些计算,结果就是机器学习,机器学习实际上会消耗很多的能量,因此我们就需要设计更好的东西,就是消耗的能量更低。我们不断地发展我们新的技术,不断地促进这方面的发现,我们可以很好地应用。你可以看到很多东西都是起源于算法的,当我们谈到融合的时候,我们可不可以把我们现有的一些技术能够把它整合到一起,能够把他们整合到同样的算法里面,能够提高它的有效性。 我给大家一个例子,在很多年前,我们努力建立一个计算机,很多计算机涵盖很多处理器和存储器,怎么融合呢,非常简单有效,就是进行架构的创新,这是关键要素所在。 这是至关重要,我们就要把这些进行创新,把他们融合在一起,在设计芯片的时候,我们也要有类似的问题需要回答。我们需要有很多的步骤采取。比如说架构,还有模拟,还有整合,还有测试,还有时间,还有功率,还有进行整合等等的一些内容,最后达成整个的过程。刚才我们提到了缓存。我们可以看到,这是我们1995年以来,在计算机设计方面等等一些方面所取得的很多的进展和融合。 对我们来说,我们能不能在这两方达成融合,就是通过团队合作,答案是对的,我们可以的。我们必须要进行这方面的一些工作,我们必须一步步地来,做重要的合成,然后并且根据它的路径和路由器等等进行整合,最后我们把它整合在一起,并且仔细地看看里面的算法,并且通过前面的一些架构的创新,来达成融合编译器。我们在这些工作做了之后,我们就知道了,我们能够做到哪些东西,我们把它们能够融合起来,能够不断地增加设计步骤的速度,可以说能增加100%,也就是原来的两倍多,并且能够使得它的响应时间更快,它使用的功率更加小,并且占据的产品空间越来越小,就是产品越来越精巧。而且我们也在这方面加进了很多人工智能的步骤,来达成更好的最后结果。 当然,最后就回到了我们经常谈到的一个课题,就是人工智能AI,它在我们人生的方方面面都离不开人工智能,这所有的东西都先要开始谈一下融合,我们实际上最伟大的一个融合机器就是我们的大脑,首先就是逻辑思维,还有进行分析。也还有一种学习的模式,能够让我们不断地学习新的东西,人脑是人类出现最伟大一个合成融合的机器。如果我们进行比较的话,如果我们把人工智能与人的大脑自然智能进行比较的话,我们就能够看到这样一个发展过程,从1997年相关的围棋、象棋,还有2015年的一些游戏等等东西。有一天它发展到一定阶段,可能把你们的母亲都可以替代掉。但我们可以想一下,我们的妈妈是一个只需要使用12W功率非常聪明的一个人。所以我们在人的大脑里,有一个非常非常深入的人工智能,要很多年才可以真的达到那种高的水平。我们可以看到,在其中有多种能力去驱动人工智能的发展,比如包括机器学习,还有通过物联网,让我们得到很多的大数据,我们经济的利益也让我们能够进入到垂直的市场里面,每一个垂直的市场都能让我们的AI有非常迅猛的发展。 这幅图的比例是有一点点不太对的,我跟你说一下,我们对我们的半导体是非常自豪的,但我们看一下我们今天的半导体,其实整个市场量只有5000亿的规模,我们看整个的软件我们还不知道有多少万亿,但我们在之前看整个GDP,有85万亿这么多,所以我们怎样把这个半导体在里面的贡献额更加地提高呢?因为现在只有5000亿这么小。我们可以看到,在整个解决方案里面,市场规模可以达到10万亿那么多。所以通过我们的摩尔法则的拉动,能够让我们整个半导体市场的规模变得更高。所以通过这种拉动,能够让我们的科技和经济有非常大的发展。 我们可以想一下,整个的规模有不断的发展,然后可能成本会越来越高,但整体通过这样一种半导体芯片体积的压缩变小,还有不断的变薄。我们还可以把它们堆叠在一块,拉在一块,我们可以看到,在这样一个小的芯片里面,里面可以包含12000亿个芯片组,晶体管等等。然后在里面有非常多层,可以把这么多的芯片提供到我们不同的运营商他们使用。 我最推荐的就是第三样,我们要让芯片变得更加专业化,用到一些具体的行业和领域里面,然后再从中建立全新的架构。在中国很多公司正在构建下一代AI的架构,他们每个公司都说,我们在做的是最好的,前所未有最好的一些芯片。当然在这里我们也面临一些挑战,我们可以看其中一个就是要用的能耗,比如损耗的能耗,动态的电能,还有大多数的能量,我们所需要的都是热能,还有一些人类所需要用的能量。在里面安全也对我们整体的流程产生一个影响,也对我们的安全还有我们所期待的可靠性也会有影响。当然,最后也会考虑到我们的隐私。 所以这些目前都是在软件领域去解决的,软件其实整个的发展流程跟整个硬件的流程其实是一样的,我们一开始的时候,就想要去完成这个软件,在我们去完成这个软件之后,我们很快就会做完这样一个过程,因为我们有一些开源的代码,我们还需要去检查它的安全性,如果我们找到问题就要解决这个问题,如果我们找到更多的问题,我们要不断地去解决它。我们会用很多的开源,可能会让我们提高更多的效率,但开源也会产生数据泄露的问题,所以未来应该怎样解决这些问题呢?我们应该在整个流程过程的最前端就开始介入。当我们再去开发的时候,我们在不断地开发过程中,要把这些问题都解决掉。有时候通过一些电子的学习,比如可以开发一些软件测试,去发现问题,然后进行直接验证,我们也要验证所有的开源,没有任何问题,然后我们也要得到一些许可,去遵守这些许可。所以这就是我们所说的向左推移的流程。 所以在我的演讲里面说了很多的主题,由于我的控制器不太灵光,让大家觉得有点卡顿,但我希望在我这里在分享的概念,智能互联关系着很多方面,它关系到我们整个指数级的发展,也关系到每个领域里面都要做向左推移的控制和管理。我们也看到了,调整我们有关结果控制的,比如说包括质量、时间和成本的调整。我们也可以看到,我们面临了很多挑战和验证的问题,我们也要打造很多的原型和样本。我们要处理很多我们需要用到的这些能量,还有我们要去处理安全、隐私、可靠性等等问题。对我来说最有趣的一个解决方案就是,这让我们有机会去改变我们过去很多事情的一些架构,为了要能够做到这一点,我们这个图是最重要的,在这个图片里面,它不仅仅是有关我们整个努力的结果,而是有关我们整个产品本来的概念。所以通过我们这样一种协作,协作就是整体的核心。 我们已经来到中国25年了,我们希望能够跟中国很多初创的企业合作。
  • 《打破国外垄断,全国产3D芯片为机器人“点睛”》

    • 来源专题:装备制造监测服务
    • 编译者:zhouyang
    • 发布时间:2020-07-09
    • 要想像人一样测量、抓取、移动和避让物体,机器人首先需要对周边世界的距离、形状、厚薄有高精度的感知,而3D视觉芯片可以引导机器人完成上述复杂的自主动作,它相当于机器人的”眼睛”和”大脑”。 近日,中科融合感知智能研究院(苏州工业园区)有限公司(以下简称中科融合)的全球首颗高精度3D-AI双引擎SOC芯片,已经在国内一家芯片代工厂进入最终流片阶段。这颗芯片将和中科融合已经进入批量的MEMS微镜3D结构光芯片,共同成为全国产高精度机器视觉的“3D之眼和脑”。 从原子的物理世界到0和1的数字世界,3D视觉“感知智能”技术是第一座桥梁。我国放量增长的工业级、消费级市场对3D芯片的刚性需求也处在爆发前夕。 中科融合这颗拥有全自主知识产权的MEMS感知芯片技术和新一代低功耗3D人工智能芯片引擎技术,填补了国内高精度3D视觉芯片的空白,将满足3D芯片存在的巨大刚需缺口,让中国制造、物流、安防、金融,甚至医疗行业都用上国产化的“3D之眼、脑”。 两颗芯片满足中国“3D之眼、脑”刚需 5G的未来在于“万物互联”。与人具有五官类似,万物互联的机器必须由各种传感器实现感知。而在各种感官中,人类的“3D视觉”,提供了我们对于世界的70%以上的感官信息。在智能制造,金融安全,混合现实等众多新兴领域,3D视觉芯片技术都属于核心基础。据知名国际调研企业Yole的报告,2023年,全球3D视觉产业将接近200亿美元。 然而,所有的高精度机器视觉系统的“3D视觉”入口都采用了美国德州仪器公司100%垄断的DLP芯片技术(3D成像市场),作为3D动态结构光光源。过去一年,包括疫情期间的2020第一季度,超过数十亿的资金投入智能机器视觉领域,如果没有这颗“DLP”芯片,以上所有的机器视觉设备都会“失明”,基于这一技术的系统投入都将付之东流。 而美国NVDIA公司的GPU芯片则作为算力芯片,被广泛用于3D建模计算和AI识别,让机器“聪明”运转。如果没有以上两种芯片,机器就像失去视力和大脑的人一般“失灵”。 中科融合是国内实现全国产替代DLP芯片在3D视觉领域的领头羊。据CEO、中国科学院苏州纳米所AI实验室主任王旭光介绍,目前市场上并不存在专用于3D的AI芯片,中科融合首次实现了AI-3D双引擎集成SOC芯片,将高精度3D建模算法引擎和基于深度学习的智能引擎,同时在单颗芯片中完成。 通过MEMS感知芯片(眼睛)和超低功耗专用AI处理器(大脑),实现高速度和高精度3D重构和识别,完成从三维物理世界到3D数字世界的转化。打通了自MEMS底层核心制造工艺和驱动控制技术,到顶层核心架构和深度学习算法的全感知智能技术链。 而直接控制MEMS,同时整合了高精度动态结构光建模引擎和自研NPU双引擎的SOC芯片,全世界第一颗高精度3D-AI芯片,不仅成本低,单价只有国外同类指标产品的三分之一上下,而且功耗低至毫瓦级,“插上充电宝就能跑起来”。“同样是高精度,DLP光机模组像砖头,我们的芯片模组只有大拇指大小,体积小功耗小,这是通过技术的代差实现的。” 电子科技大学教授周军一直专注于智能感知算法与芯片协同设计,在他看来,“人工智能芯片技术需要为应用场景服务,中科融合以中国科学院苏州纳米所的核心芯片技术为基础,集成了自研的高精度MEMS微镜芯片驱动、高精度3D建模算法引擎以及基于深度学习的AI加速引擎,是全世界第一次创新性地把AI芯片和高精度3D技术用芯片化的手段实现。”而且这枚高精度3D智能视觉芯片完全实现国产,在机器视觉、生物识别、智能家居、自动驾驶、游戏影视等众多需要3D建模和空间识别的应用场景,有广阔的应用空间。 填补国产3D感知芯片空白 作为国内第一家专注于“AI+3D”自主核心芯片技术的科技创新型企业,中科融合的创业史可以追溯到2006年设立的中国科学院苏州纳米技术与纳米仿生研究所。 2009年,国产第一代半导体芯片技术的先驱——中国科学院王守觉院士(牵头)在苏州纳米所成立高维仿生信息学实验室,为苏州纳米所播下了人工智能的种子。 数年内,多位美国,日本,新加坡海归博士加入纳米所芯片专业团队,从SOI的晶圆开始,历经七年开发了包含工艺,驱动,算法,设计和光机电整合等一系列自有知识产权工艺技术,用王旭光的话说,“团队是从烧砖头开始盖房的”。 2018年,在苏州工业园区管委会和清华启迪金控的共同支持下,中科融合正式成立,立足传感器和深度学习融合、芯片底层硬科技,助力国家实现以具有自主知识产权的MEMS微镜芯片对DLP芯片的国产替代。 这是一支国内少有的跨AI芯片设计、算法和MEMS芯片工艺的综合性人才团队。90%以上为研发人员,平均芯片研发资历超过10年。依托苏州园区顶级的MEMS芯片代工线,公司具有完整的光机电研发实验室、芯片组装超净实验室和深度学习算法实验室等完备研发条件。 据王旭光介绍,目前的国外芯片大多数是低成本、低精度。在3-30万个3D点云,类似早期的数码相机的低分辨率,“而我们的国产自研芯片可以做到上百万以上的高精度3D点云,相当于直接到了高分辨率3D相机时代。更加重要的是,在提供如此高精度的同时,可以做到和低精度相机相同的低成本、小体积。这是目前国外的DLP芯片做不到的。” “作为产业链上游的基础层技术厂商,我们将在5G时代,赋能具有边缘智能的3D感知设备,推动具有百亿美元规模的智能3D产业链的爆发,赶超国际顶尖水平。”王旭光表示,同时,已经过几个月测试核心3D智能相机模组及相关产品已经在多家企业的物流分拣自动机器、高精度医疗用扫描设备等导入应用,预计在2020年第三季度将陆续正式上市。