《边缘计算大热 AI芯片或大放异彩》

  • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
  • 编译者: 冯瑞华
  • 发布时间:2019-02-18
  • 2018年,得益于人工智能的推动,“边缘计算”首次出现在Gartner 发布的“十大战略技术趋势”中,并迅速成为年度最热科技词汇——几乎所有科技峰会都另辟分论坛搭台让边缘计算“唱戏”,几乎每个前沿科技企业的领导人都在阐述他们在边缘侧的技术储备和未来规划,几乎所有计算领域的学者、专家都对此发表了看法。边缘计算,正在被前所未有的关注着。 区别于云计算,人工智能加持的边缘侧有着种种优势,比如边缘计算处理数据更快、更安全、更高效,无需将数据传输的云端处理,不仅可以节省大量带宽,还能提升效率。当然,边缘计算的应用不会取代云计算,在未来二者将相互融合,共同提升计算效率。 对于安防而言,边缘计算的意义也显得格外重大。安防巨头海康威视CEO胡扬忠的观点,“将AI算力注入边缘,赋能边缘智能是大势所趋”。胡扬忠所言不虚,事实上,很多边缘计算能力已经进入安防场景中数量巨大的前端设备,拥有实时响应和处理的能力。 AI芯片爆发,首战瞄准安防行业 近些年,深度神经网络在图像识别、自然语言处理等方向上取得了前所未有的关注和成功,并推动了相关行业的快速发展。但是,这些应用中使用的深度神经网络的参数量巨大,模型训练与推断都需要大量的计算,传统计算芯片的算力无法满足DNN计算需求。具有高算力的AI芯片能够满足AI行业计算需求并得到了快速发展。 在时间就是金钱的市场格局中,拥有高计算能力的AI芯片一经面世就引起了产业的重大关注,在第三波AI浪潮下,无论是老牌芯片企业、科技巨头还是初创企业都纷纷加入了AI芯片的争夺战。据统计,目前创立于国内的AI芯片初创公司有13家,包括寒武纪、比特大陆、地平线机器人、西井科技、眼擎科技、熠知电子、启英泰伦、鲲云科技、深鉴科技、云天励飞、触景无限、深思考人工智能以及上海芯仑光电。 有意思的是,这13家AI芯片初创公司中有11家公司已经布局了安防领域。或许从这点我们可以看出,AI芯片的战争首战瞄准了安防行业。 业界普遍认为,AI芯片首战选择安防行业的原因在与安防行业满足了企业价值创造的两点需求:市场潜力大以及市场需求不单一。涉及公安安防,智能家居,智能交通,智能制造,智能城市等多个领域的安防行业值得让AI芯片在其中下盘大棋。 AI芯片新品接踵面世,但仍是起步阶段 据不完全统计,2018年,国内至少有半百公司推出了AI芯片战略计划或已推出了相关AI产品,华为发布重磅推出两款昇腾系列AI芯片、阿里成立平头哥半导体有限公司……并逐渐形逐渐显露出“四杰”(华为、地平线、比特大陆、寒武纪)的态势,即四大主流AI芯片公司。 以“四杰”中的B公司为例,我们来看看在这几年的时间里AI芯片的产出现状、 B公司自2015年开始研发人工智能芯片以来,先后推出了两代云端AI芯片及深度学习加速卡和服务器产品,用于大规模数据的处理。并在2018年量产发货了第一代边缘计算芯片。 据B公司称,这款边缘计算芯片是一款聚焦于边缘应用的深度学习推理人工智能芯片,可为 8位整数运算提供1TOPS算力,在Winograd 卷积加速下,支持高达2TOPS@INT8,特殊设计的 TPU 调度引擎能有效地为所有的张量处理器核心提供极高的带宽数据流。芯片内含2MB内存, 可以为性能优化和数据重用提供最佳的编程灵活性。而围绕边缘计算芯片,B公司也一次性推出了多款用于边缘计算的 AI 终端,其中包括算丰边缘计算开发板、人工智能算力棒、人工智能模块,以及一款 3D人脸识别智能终端。” 此外,B公司还设计了两款通过USB 界面、为各种边缘应用使用的AI模块和AI算力棒。两款产品均内含边缘计算芯片,通过USB接口,为传统产品增添 AI 功能,可应用于智慧工控机、机器人、工业计算机等产品上。 但需要提及的是,尽管四大主流AI芯片公司已经基本形成,且13家AI芯片初创公司中11家公司已经布局了安防领域,但总的来看,应用在安防领域的边缘计算芯片仍是是一个刚刚起步的市场,玩家并不多。例如华为在2018年宣布推出Ascend系列的边缘侧芯片,根据不同应用场景有Nano、Tiny、Lite、Mini等,Intel 收购的 Movidius 此前发布的神经计算加速棒也并未在市场上掀起太大风浪。 唯一可以肯定的一点是,作为人工智能发展支柱的AI芯片,已成为人工智能行业的核心竞争力,而以基础层的数据与芯片将在未来竞争中占据越来越重要的地位。 在未来,相信边缘计算会在安防领域大放异彩,能够填补云计算目前的不足,并在具体应用场景中实现更多能力,提升计算效率。I芯片或大放异彩

相关报告
  • 《AI与5G大热,芯片半导体行业进入爆发期》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2021-01-19
    • 元旦前后,新洁能、汇顶科技、士兰微、富满电子等多家半导体大厂发布涨价通知函,从而为整个行业涨价提供了注脚。寻根究底,寻求与供应主导着此轮涨价潮。作为高精尖科技的代表,芯片、半导体产业的风吹草动,事关各国国家战略,并吸引了嗅觉灵敏的投资人前赴后继进入芯片、半导体产业,由此,A股芯片板块持续大热的同时,该赛道的投融资热潮也一浪高过一浪。 科技日报记者注意到,企查查大数据研究院日前发布《近十年我国芯片半导体品牌投融资报告》,分析了最近十年来行业投融资变化,以及盘点最受资本青睐的明星企业。 据了解,近十年,整个行业被披露的总融资额超六千亿,并在2017年达到顶峰。 据了解,近十年来,我国芯片半导体赛道共发生投融资事件3169件,总投融资金额超6025亿元。2017年芯片半导体行业共发生投融资总金额2105亿元,为十年来最高峰,其中1500亿元融资被行业巨头紫光集团一举拿下,国资占据主导地位,成绩瞩目。 去年,该行业共发生投融资事件458起,总金额高达1097.69亿元。 2020年,芯片半导体发生投融资事件458起,拿到融资的企业共计392家,总融资金额高达1097.69亿元,最高融资金额被中芯国际拿下,合计198.5亿元,由国家基金一期、国家大基金二期、上海集成电路和国家集成电路共同注资,皆为国资背景。 资料显示,中芯国际是世界领先的集成电路晶圆代工企业之一,也是中国内地规模最大的高科技集成电路晶圆代工企业。 中芯南方、安世半导体以及中兴微电子等企业获得的融资金额同样瞩目。2020年的芯片半导体投融资赛道上,共有16家企业获得总金额超过10亿元融资,其中共计融资事件27起。 科技日报记者注意到,从近十年融资次数TOP10榜单来看,芯原股份以11次稳居榜首,利扬芯片以10次紧随其后。据了解,芯原股份是一家芯片设计平台即服务提供商,为多领域、多种终端提供半导体设计服务。除此之外,地平线机器人、寒武纪等知名品牌的融资次数也榜上有名。 AI与5G仍然是今年的大热门,芯片行业也已进入爆发期,在过去两年都取得了跨越式进展。 值得注意的是,2020年芯片半导体赛道共发生A轮以及pre-A轮融资111起,占比约为24%。从这两年的发展来看,获得融资的企业正在变多,总金额也在逐步扩大,芯片行业的未来让人充满想象。
  • 《盘点2019年全球十大AI芯片》

    • 来源专题:集成电路
    • 编译者:shenxiang
    • 发布时间:2019-12-25
    • 人工智能 浪潮的推动下,AI相关产业的商用场景正逐步大规模落地,基于AI技术的三大支柱:“算法+大数据+计算能力”智能应用已成为计算机最主要的负载之一。我国在用户数据方面拥有数量的先天优势,但面对有限的规模、结构固定、能耗受限的硬件制约下,如何用AI芯片处理海量的并不断演进的深度学习算法呢?跟随OFweek编辑一起来看看各大科技巨头们研发的AI芯片吧。(排名按首字母顺序排列) 1.含光800 2019年的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的 AI芯片——含光800。在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比500 IPS/W,一个含光800的算力相当于10个GPU。 目前,含光800已经实现了大规模应用于阿里巴巴集团内多个场景,例如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。以杭州城市大脑实时处理1000路视频为例,过去使用GPU需要40块,延时为300ms,单路视频功耗2.8W;使用含光800仅需4块,延时150ms,单路视频功耗1W。 2.Graphcore IPU 总部位于英国布里斯托的Graphcore公司日前推出了一款称为智能处理单元(IPU)的新型AI加速处理器。芯片本身,即IPU处理器,是迄今为止最复杂的处理器芯片:它在一个16纳米芯片上有几乎240亿个晶体管,每个芯片提供125 teraFLOPS运算能力。一个标准4U机箱中可插入8张卡,卡间通过IPU链路互连。8张卡中的IPU可以作为一个处理器元件工作,提供两个petaFLOPS的运算能力。与芯片在CPU和GPU中的存在形式不同,它为机器智能提供了更高效的处理平台。 Graphcore公司于2016年启动风险投资计划,并在2018年12月的最后一轮融资中募集了2亿美元。基于其17亿美元的公司估值,Graphcore已成为西方半导体界的唯一“独角兽”。它的投资者们包括戴尔、博世、宝马、微软和三星。 3.Inferentia芯片 2019年,亚马逊的云服务业务AWS在其发布会AWS re:Invent上带来了高性能机器学习加速芯片Inferentia。据了解,AWS Inferentia 是一个由 AWS 定制设计的机器学习推理芯片,旨在以极低成本交付高吞吐量、低延迟推理性能。该芯片将支持 TensorFlow、Apache MXNet 和 PyTorch 深度学习框架以及使用 ONNX 格式的模型。 每个 AWS Inferentia 芯片都能在低功率下支持高达 128 TOPS(每秒数万亿次运行)的性能,从而为每个 EC2 实例启用多个芯片。AWS Inferentia 支持 FP16、BF16 和 INT8 数据类型。此外,Inferentia 可以采用 32 位训练模型,并使用 BFloat16 以 16 位模型的速度运行该模型。与EC4上的常规Nvidia G4实例相比,借助Inferentia,AWS可提供更低的延迟和三倍的吞吐量,且每次推理成本降低40%。 4.昆仑芯片 2019年尾声,百度宣布首款AI芯片昆仑已经完成研发,将由三星代工生产。该芯片使用的是三星14nm工艺技术,封装解决方案采用的是I-Cube TM。 据悉,昆仑AI芯片提供512Gbps的内存带宽,在150瓦的功率下实现260TOPS的处理能力,能支持语音,图像,NLP等不同的算法模型,其中ERNIE模型的性能是T4GPU的三倍以上,兼容百度飞桨等主流深度学习框架。该款芯片主要用于云计算和边缘计算,预计在2020年初实现量产, 5.Nervana NNP 芯片 2019 英特尔人工智能峰会,英特尔推出面向训练 (NNP-T1000) 和面向推理 (NNP-I1000) 的英特尔 Nervana 神经网络处理器 (NNP)。据了解,Nervana NNP-T 代号 Spring Crest,采用了台积电的 16nm FF+ 制程工艺,拥有 270 亿个晶体管,硅片面积 680 平方毫米,能够支持 TensorFlow、PaddlePaddle、PYTORCH 训练框架,也支持 C++ 深度学习软件库和编译器 nGraph。 Nervana NNP-I,代号为 Spring Hill,是一款专门用于大型数据中心的推理芯片。这款芯片是基于 10nm 技术和 Ice Lake 内核打造的,打造地点是以色列的 Haifa ,Intel 号称它能够利用最小的能量来处理高负载的工作,它在 ResNet50 的效率可达 4.8TOPs/W,功率范围在 10W 到 50W 之间。 6.Orin芯片 2019年NVIDIA GTC中国大会中英伟达发布了全新的软件定义自动驾驶平台——NVIDIA DRIVE AGX Orin,该平台内置全新Orin系统级芯片,由170亿个晶体管组成。 Orin系统级芯片集成了NVIDIA新一代GPU架构和Arm Hercules CPU内核以及全新深度学习和 计算机视觉 加速器,每秒可运行200万亿次计算,几乎是NVIDIA上一代Xavier系统级芯片性能的7倍。此外,Orin可处理在自动驾驶汽车和机器人中同时运行的大量应用和深度神经网络,并且达到了ISO 26262 ASIL-D等系统安全标准。 7.邃思DTU 由腾讯领投、融资累计超过 6 亿元的 AI 芯片公司燧原科技,在2019年发布会中推出自主研发的首款 AI 训练芯片“邃思 DTU”。 据了解邃思DTU采用格罗方德12nm FinFET工艺,480平方毫米主芯片上承载141亿个晶体管,实现2.5D高级立体封装,据称单卡单精度算力为业界第一,达20TFLOPS,首次支持混合精度,半精度及混合精度下算力达80TFLOPS,最大功耗仅225W。 邃思芯片基于可重构芯片的设计理念,其计算核心包含 32 个通用可扩展神经元处理器(SIP),每 8 个 SIP 组合成 4 个可扩展智能计算群(SIC)。SIC 之间通过 HBM 实现高速互联,通过片上调度算法,数据在迁移中完成计算,实现了 SIP 利用率最大化。 8.思元220芯片 寒武纪在第21届高交会正式发布边缘AI系列产品思元220(MLU220)芯片及M.2加速卡产品,标志寒武纪在云、边、端实现了全方位、立体式的覆盖。 思元220芯片采用了寒武纪在处理器架构领域的一系列创新性技术,其架构为寒武纪最新一代智能处理器MLUv02,实现最大32TOPS(INT4)算力,而功耗仅10W,可提供16/8/4位可配置的定点运算。作为通用处理器,支持各类深度学习技术,支持多模态智能处理(视觉、语音和 自然语言处理 ),应用领域广泛,客户可以根据实际应用灵活的选择运算类型来获得卓越的人工智能推理性能。 9.昇腾910 2019年8月,华为在深圳总部发布AI处理器Ascend 910(昇腾910),据华为发布的参数显示,昇腾910是一款具有超高算力的AI处理器,其最大功耗为310W,华为自研的达芬奇架构大大提升了其能效比。八位整数精度(INT8)下的性能达到512TOPS,16位浮点数(FP16)下的性能达到256 TFLOPS。 作为一款高集成度的片上系统(SoC),除了基于达芬奇架构的AI核外,昇腾910还集成了多个CPU、DVPP和任务调度器(Task Scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。 昇腾910集成了HCCS、PCIe 4.0和RoCE v2接口,为构建横向扩展(Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。HCCS是华为自研的高速互联接口,片内RoCE可用于节点间直接互联。最新的PCIe 4.0的吞吐量比上一代提升一倍。 10.征程二代 2019世界 人工智能大会 中,人工智能芯片初创公司地平线正式宣布量产中国首款车规级人工智能芯片——征程二代,并且获得五个国家市场客户的前装定点项目。 据介绍,征程二代于今年初流片成功,搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4TOPS的等效算力,典型功耗仅2瓦,满足AEC-Q100标准,算力利用率超过90%,每TOPS算力可以处理的帧数可达同等算力GPU的10倍以上,识别精度超过99%,延迟少于100毫秒,多任务模式下可以同时跑超过60个分类任务,每秒钟识别目标数可以超过2000个。 此次地平线率先推出首款车规级AI芯片不仅实现了中国车规级AI芯片量产零的突破,也补齐了国内自动驾驶产业生态建设的关键环节。 小结 目前通过CPU/GPU处理人工神经网络效率低下,谷歌大脑需要1.6万个CPU核跑数天方能完成猫脸识别训练;AIpha GO与李世石下棋时用了1000个CPU和200个GPU,AI芯片的发展是第三次AI浪潮中极为明显的趋势,算法已渗透到云服务器和智能手机的方方面面,未来每台计算机可能都需要一个专门的深度学习处理器。