《2018年以后的人工智能软硬件和应用将如何发展?》

  • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
  • 编译者: 冯瑞华
  • 发布时间:2018-01-16
  • 在2018年及其以后,深层神经网络和机器学习在更大的人工智能(AI)领域会如何发展?我们如何能开发出越来越复杂的机器以在日常生活中帮助人类?这些都是普渡大学机器学习硬件教授尤金尼奥·库鲁尔塞罗(Eugenio Culurciello)关注的问题。请注意,本文的重点并非有关AI的预测,而是对该领域发展轨迹、趋势以及技术需求的详细分析,以帮助创造更有用的AI。当然,并非所有的机器学习都是针对AI的,还有些其他容易实现的目标,下面我们就仔细审视下。

    目标

    AI领域的目标是通过机器上实现人类和超人的能力,以便让它们在日常生活中帮助我们。自动驾驶车辆、智能家居、智能助理以及安全摄像头将是植入AI技术的首批目标,家庭烹饪和清洁机器人、无人侦察机和机器人则是第二批目标。其他目标还有移动设备上的助理,全职陪伴助理(可以听到和看到我们的生活经历)。而AI领域的终极目标是打造完全自主的合成实体,它可以在日常工作中以相当于人类或超越人类的水平行事。

    软件

    在这里,软件被定义为通过优化算法训练的神经网络构架以解决特定的任务。今天,神经网络是用来学习解决问题的实际工具,其中涉及通过大数据集进行分类学习。但这并不是全部AI,它要求在现实世界中,在没有监督的情况下学习,也要吸取以前从未见过的经验,常常需要把以前学到的知识结合起来以解决当前的挑战。

    如何让目前的神经网络演变成AI?

    神经网络架构:几年前,当神经网络架构发展起来的时候,我们经常认为从数据中自动学习算法的参数拥有巨大优势,而且这比手工编写的算法功能更强大。但我们忘了提到一个小细节,那就是作为“训练解决特定任务基础”的神经网络架构并未从数据中学习。事实上,它仍然是开发人员手工设计的。有鉴于此,目前它成为AI领域的主要限制之一。

    然而,神经网络架构是学习算法的基本核心。即使我们的学习算法能够掌握新的技能,如果神经网络不正确,它们也无法得出正确结果。从数据中学习的神经网络架构存在的问题是,目前在一个大数据集上进行多架构实验花费的时间太长。我们必须尝试从头开始训练多个架构,并看看哪一个最有效。这就是我们今天使用的、非常耗时的试错过程!我们应该克服这一限制,并在这个非常重要的问题上多加思考。

    无监督学习:我们不能总是干预神经网络,引导它们的每一次体验。我们不能在每个实例中都纠正它们,并提供它们的性能反馈。我们的生活也要持续下去!但这正是我们今天利用受监督神经网络所做的:我们为每个实例提供帮助,使它们能够正确执行。相反,人类只需从少数几个例子中学习,并且能够以连续的方式自我校正和学习更复杂的数据。

    预测神经网络:目前神经网络的一个主要局限是它们没有人类大脑最重要的特征之一,即预测能力。关于人脑如何工作的一个主要理论是它能不断地预测,即拥有预测代码。如果你仔细想想,就会发现我们每天都在使用它。你提起一个自认为很轻的物体,但结果它却很重。这会让你感到惊讶,因为当你接近它的时候,你已经预测它将如何影响你和你的身体,或者你的整体环境。

    预测不仅能让我们了解世界,还能知道我们什么时候不了解它,什么时候该学习。事实上,我们保存那些我们不知道并让我们感到吃惊的事情的信息,以便下次不会再犯同样的错误!认知能力绝对与我们大脑中的注意力机制有明显的联系:我们天生就有能力放弃99.9%的感官输入,只专注于对我们生存至关重要的数据,包括哪里存在威胁,哪里是我们逃避它的地方。或者,在现代世界里,当我们匆忙出门时,我的手机落在哪里。?构建预测神经网络是我们与现实世界互动的核心,并能在复杂的环境中发挥作用。因此,这是任何强化学习的核心网络。

    当前神经网络的局限性:无法预测,无法解释理由,以及暂时的不稳定性,因此我们需要一种新的神经网络。神经网络胶囊(Neural Network Capsules)就是解决当前神经网络局限性的一种方法,但我们认为它必须有些额外的特点:

    1)视频帧操作:这很简单,因为我们需要做的就是让胶囊路由查看最近时间的多个数据点。这相当于在最近的重要数据点上建立起关联内存。请注意,这些不是最近帧的最新表达,而是它们最新的不同表达。可以通过仅保存与预定义值不同的表达来获得不同内容的不同表达。这个重要的细节只允许保存最近历史上的相关信息,而不是一系列无用的相关数据点。

    2)预测神经网络能力:这已经是动态路由的一部分,它迫使各层预测下一层表达。这是一种非常强大的自我学习技巧,在我们看来,它胜过了我们在社区中发展的所有其他非监督表现学习。胶囊现在需要能够预测长期的时空关系,但目前还没有实现。

    持续学习:这是很重要的,因为神经网络需要不断地学习新的数据点来维持生存。目前的神经网络不能学习新的数据,而每次都需要从头开始重新训练。神经网络需要能够自我评估接受重新训练的必要性,以及它们确实知道某些事情的事实。这也需要在现实生活和强化学习任务中表现出来,我们想让机器在不忘记旧任务的情况下完成新任务。

    转移学习:或者称我们如何让这些算法通过观看视频自学,就像我们学习如何烹饪新的东西一样。这是一种能力,需要我们上面列出的所有因素,而且对于加强学习也很重要。现在你可以通过举例子的方式来训练你的机器去做你想让它做的事情,就像我们人类一样。

    强化学习:这是深神经网络研究的“圣杯”,即教机器如何在真实的世界环境中学习!这需要自学、持续学习、预测能力,还有很多我们不知道的东西。在强化学习领域有很多东西需要了解,但对作者们来说,这只触及到问题的表面。

    强化学习通常被称为“蛋糕上的樱桃”,意思是它只是塑料合成大脑上微不足道的训练。但是,我们如何才能得到一个“通用”大脑轻松地解决所有的问题呢?这是个“先有鸡还是先有蛋”的问题!今天,要想一个个地解决强化学习的问题,我们需要使用标准神经网络:一个深度的神经网络,它接收大量的数据输入,如视频或音频,并将其压缩成表示;一个序列学习神经网络,如RNN,以便了解任务。

    这两个部分都是问题的明显解决方案,目前显然是错误的,但这是每个人都在使用的,因为它们是当前可用的构建块。这样的结果并不令人印象深刻:我们可以从头开始学习玩视频游戏,并且掌握像国际象棋和围棋这样完全可观察的游戏,但无需多言,与在复杂的世界中解决问题相比,这些都是微不足道的。想象下,AI可以比人类更好地玩转《Horizon Zero Dawn》,对此我拭目以待!

    但这恰是我们想要看到的,即能像我们人类这样运作的机器。我们对强化学习的建议是,使用可以连续操作的预测神经网络和联想存储器来存储最近的经验。

    不要更多的递归神经网络(RNN):因为它们在并行化方面表现特别糟糕,甚至在特殊的定制机器上也很慢,因为它们的内存带宽使用率很高,内存带宽存在限制。基于注意力的神经网络更高效,可更快速地进行训练和部署,并且在训练和部署方面的可伸缩性更少。在神经网络中,注意力有可能使许多架构发生真正的改变,但它并没有得到应有的认可。联想记忆和注意力的结合是下一波神经网络发展的核心。我们认识到,基于注意力的神经网络将逐渐取代基于RNN的语音识别,并在强化学习构架和通用人工智能中找到它们的方法。

    分类神经网络中信息的定位:实际上这是一个已经解决的问题,将被嵌入到未来的神经网络架构中。

    硬件

    深度学习硬件才是进步的核心。现在让我们忘记2008-2012年深度学习的快速扩展,近年的进步主要取决于硬件:在社交媒体的帮助下,每部手机上的廉价图像传感器都可以收集巨大的数据集,但其只处于次级重要程度。GPU允许加速深层神经网络的训练。在过去2年里,机器学习硬件蓬勃发展,尤其是针对深度神经网络的硬件。

    有几家公司正在这个领域努力,包括英伟达、英特尔、Nervana、Movidius、Bitmain、Cambricon、Cerebras、DeePhi、谷歌、Graphcore、Groq、华为、ARM以及Wave Computing等,他们都在开发定制的高性能微型芯片,能够训练和运行深层神经网络。关键是提供最低功耗和最高的可测量性能,同时计算最近有用的神经网络操作,而不是每秒钟的原始理论操作。但是在这个领域很少有人了解硬件是如何真正改变机器学习、神经网络和AI的,很少有人知道微型芯片的重要性以及如何开发它们。

    训练或推理:许多公司都在制造能提供神经网络训练的微型芯片。这是为了获得英伟达市场的一部分,它是迄今为止事实上的培训硬件。但这种训练只占深层神经网络应用的很小部分。对于每个训练步骤,实际应用程序中都有上百万个部署。例如,你现在可以在云端使用的一个目标检测神经网络,它曾经被训练过一次,并且在很多图像上都是可以使用的。但是一旦经过训练,它就可以被数以百万计的计算机用于数十亿的数据。

    我们在这里想说的是,训练硬件的重要性和你所使用的次数相比是微不足道的,而制作用于训练的芯片组需要额外的硬件和额外的技巧。这将导致相同性能却消耗更高的功率,因此不是当前部署的最佳状态。训练硬件是很重要的,而对推理硬件进行修改却很简单,但它并不像许多人认为的那样重要。

    应用程序:能够更快、更低功率地提供培训的硬件在这个领域非常重要,因为它将允许更快地创建和测试新的模型和应用程序。但真正重要的一步是应用所需的硬件,主要是推理硬件。今天有许多应用之所以无法使用,主要是因为硬件而不是软件。例如,我们的手机可以是基于语音的助手,目前是次优的,因为它们不能一直运行。就连我们的家庭助理也离不开电源,除非我们在周围安装更多麦克风或设备,否则就不能跟着我们。但也许最大的应用是将手机屏幕从我们的生活中移除,并将其嵌入到我们的视觉系统中。如果没有超级高效的硬件,所有这些和更多的应用将是不可能的。

    赢家和输家:在硬件方面,赢家将是那些能够以最低功耗发挥更高性能、并能将设备迅速投入市场的公司。想象用手机代替SoC,这种情况每年都会发生。现在想象下将神经网络加速器嵌入到内存中。这可能会更快地征服市场,并快速渗透,这就是我们所说的赢家。

    应用程序

    我们在上面的“目标”部分简要地讨论了应用程序,但是我们需要详细讨论一下。AI和神经网络将如何进入我们的日常生活?这是我们的名单:

    分类图像和视频:已经存在于许多云服务中。下一步就是在智能摄像头领域做同样的事情,今天在这里也有许多供应商。神经网络硬件将允许移除云并在本地处理越来越多的数据,保护隐私和节省网络带宽将成为赢家。

    语音助理:它们正在成为我们生活中的一部分,可以在我们的智能设备中播放音乐和控制基本设备。但是对话是一种基本的人类活动,我们常常认为它是理所当然的。你可以对话的小型设备是一场正在发生的革命。语音助理正变得越来越好,可以更好地服务于我们。但它们仍然与电网相连,我们想要的真正助理应该能随时伴在我们身侧。

    手机怎么样?硬件在这里再次胜出,因为它将使上述期望成为可能。Alexa、Cortana以及Siri可以始终陪伴着你。手机很快就会成为你的智能家居设备,这又是智能手机的又一次胜利。但我们也希望它在我们的车里,并伴随我们在城市中移动。我们需要本地处理语音,减少云端支持。更多的隐私和更少的带宽成本。硬件有望在1-2年内提供给我们。

    真正的智能助理:语音助理已经很棒,但我们真正想要的是能看到我们所看到东西的助理。当我们四处走动时,它能分析我们的环境。而神经网络硬件将会再次满足你的愿望,因为分析视频是非常昂贵的,而且目前在理论上限制了当前的硅硬件。换句话说,要做的事情比做语音助理要难得多。但这并不是不可能的,像AiPoly这样的许多智能初创公司已经拥有了类似软件,但是缺少强大的硬件来运行它。还要注意的是,用可穿戴的玻璃设备代替手机屏幕真的会让我们的助手成为我们的一部分!

    烹饪机器人:下一个最大的设备将是烹饪和清洁机器人。在这里,我们可能很快就有硬件,但我们显然缺乏软件。我们需要转移学习、持续学习和强化学习。一切都像魔法那样,因为你知道:每个食谱都是不同的,每种烹饪成分看起来都不一样。我们不能硬编码所有这些选项。我们真的需要一个可以学习和推广的合成实体来做这个。我们离它还很远,但并非遥不可及。以目前的速度前进,可能只需要几年就能实现。正如我在过去几年所做的那样,我感肯定这些都能实现。

相关报告
  • 《多国人工智能产业加速发展》

    • 来源专题:装备制造监测服务
    • 编译者:zhangmin
    • 发布时间:2020-12-29
    • 当前,以人工智能(AI)为代表的新兴信息技术蓬勃发展,人工智能应用技术正加速普及,特别是在医疗健康、教育、金融、安全防务等专业服务领域。咨询公司麦肯锡的一项最新研究发现,疫情防控以来,传统经济加快智能化转型,加速了以人工智能为代表的新技术转化速度,预计到2030年约有30%的工作岗位将实现自动化、智能化。   智能研发提速 机器人显身手   韩国MBN电视台近日推出本国第一位人工智能主播。外形和真人几乎完全相同的人工智能主播,模仿真人的声音和语调,顺利播报了当日的主要新闻和若干条快讯。MBN电视台表示,人工智能主播可以在发生灾难等紧急情况时,迅速向观众播报新闻内容,并可全天候持续工作,节省了大量人力、时间和费用成本。   德国的人工智能医疗机器人“阿达”一直备受关注。当人们在“阿达”的应用界面中输入症状后,“阿达”会通过人工智能算法分析评估病人的症状并给出治疗建议。“阿达”的诊疗“天赋”源于70多名医生、数学家、数据专家和计算机科学家的知识与经验。负责开发“阿达”的科技公司负责人纳特哈特表示:“我们用了7年时间专注研究人工智能的数据处理问题,并建了一个全球医学专家网络来提供医学支持。”目前,全球已有超过300万人使用过“阿达”。2017年,这家初创企业获得了4000万欧元投资。   去年11月,日本NTT公司和日本国立情报学研究所宣布,其研发的人工智能技术挑战当年日本“高考”英语满分200分的笔试题,获得了185分的高分。NTT公司称,他们一直致力于提高人工智能对英语笔试题的自动解答技术、提升其借助深度学习所获得的自然语言处理知识。自2011年起,日本国立情报学研究所和东京大学等合作发起人工智能项目,检验人工智能可在多大程度上模拟人类思考以及解决问题的能力。   不久前,第二届欧盟人工智能联盟大会集中展示了一批典型案例,介绍人工智能应用技术如何助力疫情防控。比如,训练智能机器人来照顾新冠肺炎患者,利用人工智能系统分析病人肺部CT,以减轻医护人员工作压力。比利时鲁汶大学医学影像研究中心主席兼教授苏艾腾表示,实践证明,人工智能比放射医师更能有效地分析肺部CT。   多国出台政策 力促产业发展   近年来,越来越多国家出台政策扶持人工智能产业发展。欧盟今年2月发布《人工智能白皮书》,力促人工智能产业发展。在过去3年里,欧盟用于人工智能研究和创新的资金增至15亿欧元,同比增长70%。欧盟近期还提出了一项重大的专项拨款,用于支持在“数字欧洲”计划下的人工智能研究项目。欧盟希望未来10年每年吸引超过200亿欧元的投资用于人工智能领域。   法国2018年5月出台“法国人工智能战略”,从政策层面力促研究机构将人工智能研发成果商业化。法国政府计划在2022年底前投入15亿欧元用于人工智能产业发展。仅2019年,法国新注册的人工智能企业就达102家。   2019年12月,韩国政府发布“人工智能国家战略”,提出九大领域100个课题,计划2030年时将韩国在人工智能领域的竞争力提升至世界前列。韩国政府力争到2021年成功打造人工智能开发平台、全面开放公共数据,到2024年建立光州人工智能园区,到2029年为新一代存算一体人工智能芯片研发投入约1万亿韩元(1美元约合1090韩元)。   去年6月,日本政府出台“人工智能战略2019”,旨在从全球范围内吸引人才,增强本国人工智能产业竞争力。去年12月,东京大学和软银公司签署协议,宣布将共同打造世界顶尖的人工智能研究所,致力于开展人工智能的基础研究和应用研究。软银将在今后10年为此投资200亿日元(1美元约合104日元)用于相关研究,促进日本人工智能研究及相关产业发展。   应用前景广阔 助益经济增效   专家表示,未来全球可持续增长越来越依赖于数据所创造的价值,而人工智能是数字经济中最重要的应用技术之一。人工智能将在精准农业、远程医疗、自动驾驶等方面大有作为。   普华永道的最新研究指出,到2030年,凭借运用人工智能技术的创新型产品与效率的提升,全球经济总量有望额外增长13.4万亿欧元。研究认为,德国大部分行业尤其是医疗、能源和汽车行业的生产率将因人工智能技术应用而显着提高,预计到2030年德国经济将实现11.3%的额外增加值。韩国政府预计,如果人工智能国家战略相关措施得以有效实施,到2030年,韩国将在人工智能领域创造455万亿韩元经济效益。   日本经济产业省对制造业及建筑业等大约2000家中小企业和提供人工智能服务的企业实施调查,并筛选出可用人工智能替代的业务,估算出如果中小企业引进人工智能技术,到2025年将产生11万亿日元的经济效益,可在一定程度上解决少子老龄化造成的劳动力缺口问题。   韩国延世大学教授金时镐指出,随着人工智能产业的发展,各国政府需要研究各种可能出现的新问题,包括以基本劳动力为中心的工作岗位消失、人工智能服务安全性、数据安全等问题,提前研究应对策略以及必要的法律和制度修订。 作者:牛瑞飞 马菲
  • 《人工智能车辆迎来快速发展》

    • 来源专题:新一代信息技术
    • 编译者:isticzz2022
    • 发布时间:2024-03-15
    •        随着汽车市场经历了前所未有的变革,需要应对更多自主性的需求、越来越先进的用户体验以及电动化的趋势,软件和人工智能汽车电子产品的复杂性激增。        Arm不断发展的生态系统推出了Arm Automotive Enhanced(AE)处理器和新的虚拟平台,将汽车开发周期加快了两年,这被视为系列行业第一。Arm汽车业务线高级副总裁兼总经理Dipti Vachani表示:“我们首次将基于Armv9的技术引入汽车行业,使该行业能够利用最新一代Arm架构所提供的人工智能、安全和虚拟化功能。为了满足当今汽车日益增长的性能需求,我们正在利用我们在基础设施市场的领先地位,将服务器级Neoverse技术以及基于Armv9的Cortex-A新产品引入汽车领域,以实现可扩展性。” Arm宣布的全系列产品包括: Arm Neoverse V3AE:首次将Neoverse技术引入汽车行业,为人工智能加速的自动驾驶和ADAS工作负载提供服务器级性能 Arm首款基于v9的Cortex-A处理器,专为汽车打造: Arm Cortex-A720AE:为广泛的软件定义车辆(SDV)应用提供业界领先的持续性能和SoC设计灵活性 Arm Cortex-A520AE:提供领先的电源效率和功能安全功能,可扩展到汽车用例 Arm Cortex-R82AE:有史以来性能最高的实时处理器,功能安全,首次将64位计算提供给实时处理 Arm Mali-C720AE:一款可配置ISP,专为最苛刻的计算机和人类视觉用例而优化        一系列可配置的系统IP,使Arm硅生态系统能够提供可扩展的高性能汽车SoC。瓦查尼说:“我们并没有就此止步。展望未来,我们看到系统只会变得更加复杂,对安全的需求将变得更加迫切,我们需要为合作伙伴将所有这些计算组件整合在一起,在重要的地方实现一致性标准化。Arm CSS for Automotive将提供Arm AE IP的预集成和验证配置,该配置使用先进的铸造工艺对性能、功率和面积进行了优化。我们的第一个汽车CSS预计将于2025年交付。”        传统的汽车开发周期与处理器IP的交付和硅的开发是线性的,只有大约两年后硬件可用,软件开发人员才能开始。Vachani表示:“我们正在用这种新方法改变这一点:在业界领先的最新一代Arm AE IP上进行虚拟原型设计,这使软件开发人员能够在物理硅可用之前开始。我们正在与包括亚马逊网络服务(AWS)、Cadence、Corellium、西门子和其他公司在内的行业领导者合作,提供这些虚拟平台和云解决方案,与包括Autoware Foundation、BlackBerry QNX、Elektrobit、Kernkonzept、LeddarTech、Mapbox、Sensory、Tata Technologies、TIER IV、Vector等在内的合作伙伴合作,实现整个软件堆栈的早期、更无缝的开发。”        Arm表示这将使汽车生态系统能够为开发者释放新的机会,并加快领先原始设备制造商、汽车一级供应商、硅合作伙伴和软件提供商的上市时间,这些公司都在努力提供未来的软件定义汽车。