《Groq芯片爆火给我国AI芯片产业发展的启示》

  • 来源专题:新一代信息技术
  • 编译者: isticzz2022
  • 发布时间:2024-03-04
  •     近日,硅谷初创企业Groq推出一款全新的AI芯片,声称实现了“地表最强推理”——在Groq上运行大模型的推理速度较英伟达GPU提高10倍甚至更高。该消息一出,迅速攻占了各大科技媒体板块头条。这样的推理速度无疑是AI芯片领域的一次技术飞跃,也为国产AI芯片企业如何突围发展带来一些新启示。


    可专注特定场景建立“比较优势”

        Groq芯片是一种LPU(语言处理单元),其优越的推理性能,再一次展示了专用AI芯片在特定场景中的应用价值。因此,参考Groq芯片在某个应用场景做到替代或者超过英伟达,将有可能是国产AI芯片现阶段一条行之有效的发展路径。

    比如这款推理芯片主打一个“快”。常规生成式AI主要使用英伟达A100、H100芯片来进行训练与推理工作,大模型推理过程中等待是相对比较正常的事情,字符一个个蹦出,半天才能回答完毕。但在Groq的演示平台上,模型收到提示词后,几乎能够立即生成答案。这些答案不仅相对质量较高,还附有引用,长度更是达到数百个单词。更令人惊讶的是,它超过3/4的时间是用于搜索信息,而生成答案的时间却短到只有几分之一秒。

        虽然暂时有着种种缺点,但是Groq芯片的优势点太为突出,足以在某些场景下完全替代英伟达,甚至能做得更为优秀,自然而然吸引了大量关注及认可。可以想象,在Groq芯片的成本控制优化至合适区间后,将会有大量实际应用场景前来适配和使用。

    需重视应用场景中的“性能匹配”

        Groq芯片凭借推理速度脱颖而出,充分说明了其性能与应用场景之间的强相关性,这也再次提醒我们应用场景的重要性。国产AI芯片产业应当重视在实际应用场景中的性能匹配度,并在这一基础上开展芯片的优化和创新。

    语言推理赛道上,谁是冠军也尚未一锤定音。目前来看,Groq芯片综合素质仍有相当的不足。比如Groq芯片每张卡的内存是230MB,在运行Llama-2 70B模型时,需要305张Groq卡才足够,而用H100则只需要8张卡。从目前的价格来看,这意味着在同等吞吐量下,Groq的硬件成本是H100的40倍,能耗成本是10倍。另外,Groq芯片目前只能适配少数几个大模型的推理工作,并且需要大量调试,广泛应用性还相对较差。其中的差距,也是中国企业的创新机会。

        最终,一种AI芯片产品能否胜出,和多种因素密切相关,包括芯片本身的技术路线、产品推出的时间点,以及大模型的成熟度,等等。对于大模型来说,目前有观点认为大模型已经开始趋向稳定了,在这个基础上开发芯片是有机会的;也有观点认为大模型变化还很快,过两年大模型一改,所有的投入又得重新开始。这些争论还有待时间检验。

    借助第三方评测体系“精准定位”

        当前,美国政府对我国芯片出口管制的层层加码对国产AI芯片行业既是挑战又是机遇。从产业发展的整体视角来看,亟需构建一个中立、客观并具有权威性的评测体系,为各种芯片提供一个公平竞技的舞台和场景匹配的渠道。

    在2023年世界人工智能大会上,人民日报社传播内容认知全国重点实验室(人民网)与中国电子技术标准化研究院共同发起的“智越计划”提出,要共同推动建立包含人工智能芯片性能评测、场景评测与综合评测的整体评估评测标准体系。其中的场景评测就是测试不同人工智能应用场景中各款芯片的实际使用效果。

        “智越计划”将最终形成针对特定应用场景的综合报告和产品推荐目录,从而助力优化市场供需匹配,为政府、企业和研究机构建设智算中心提供芯片选型的重要参考和决策依据。

        随着AI技术的飞速进步,市场对芯片产品的性能、稳定性和适用性有了更高要求。一个科学完善的评测体系将有效地指引企业研发方向,推动生态的繁荣发展和行业的整体进步。


  • 原文来源:http://finance.people.com.cn/n1/2024/0303/c1004-40187770.html#liuyan
相关报告
  • 《物联网芯片及其发展难题》

    • 来源专题:集成电路
    • 编译者:shenxiang
    • 发布时间:2020-12-11
    • 从中兴事件,一直到中美贸易持续升温,我国芯片行业受制于人的问题已经被大多数人悉知。因此一波造芯热潮来了,但造芯片并不是那么容易的事情,而且对于中国来说,除了手机用的SOC和PC使用的 CPU 之外,还有很多芯片制造能力技不如人。比如存储颗粒也是其中之一,还需要长时间的艰苦奋斗才能追赶上。 在芯片领域除了刚才说的这些之外,其实还有一个新名词,叫做物联网芯片,这个名词之前并不存在,直到近些年Internet of things( IOT 物联网)火爆之后才有这这种说法。 什么是物联网芯片? 芯片我们知道有很多种,那么什么是物联网芯片呢?首先得知道什么是物联网,简单点说就是物物相连的互联网,他的核心依然是互联网,但在基础上衍生和拓展,不仅仅是基于人而是打通了物和物之间的连接通道。物联网也被普遍认为是信息产业发展的第三次浪潮,将带动整个世界的变化。 物联网芯片其实最终还是芯片,只不过作用更加细分化,与传统芯片相比有一定区别,尤其是在商业化方面。因为传统的芯片智能用在特定的需要有计算处理的地方,而物联网芯片更加灵活,主要是基于日常生活的,比如门窗、家电、甚至衣服鞋帽等等,对技术的要求更高,也更注重应用场景的针对性。 当然了,本质上它还是 集成电路 ,只不过更有指向性,需要应用到特定的环境当中,对于企业来说,也提出了更高的需求,因为物联网芯片的用户需要的更多是一套解决方案,往往不仅仅是单一的芯片产品。 物联网芯片面临的两大难题 根据数据显示,2015年全球物联网连接大约60亿个左右,预计2020年将增长到270亿个,这还是比较保守的预计数字。而根据工信部发布的数据显示2017年物联网产业规模已经突破万亿,至IJ2020年,仅仅中国的物联网整体规模就会达到1.8万亿,而其中最重要的物联网芯片,将会在2025年之前一致保持高增长和高产业价值。 但是要想站稳物联网芯片的脚跟可不容易,面临这两个非常严重的问题。 1、针对性 无论是PC处理器还是手机SOC,对于大公司来说,一款产品或者一系列产品一旦打造完成,通常可以大量出货。比如 高通 公司的骁龙660处理器出货量是几千万片或者上亿片。 华为 麒麟处理器虽然只供给自己家的产品,但手机销量也是以百万台计数的,这就意味着这些SOC的出货量都是百万级起步。而物联网是万物互联,意味着要面临各种各样的产品提出很多种解决方案。这就面临这严重的细分化问题,虽然有些芯片的需求量很大,但总体来说种类散乱,虽然整体规模很大,但摊下来单一产品或者系列产品的需求量可能并不大。 一次就要求企业需要能够控制成本,及时的推出更有针对性的芯片来解决问题,否则通用型芯片虽然也可以解决问题,但功耗、性能等等很难匹配,并不是长久之计。当企业需求芯片只是几万、几十万片的时候,厂商如何满足他们,并保证自己盈利?现在看的确是个难题。 2、安全 物联网时代面临的最大问题首先就是安全,安全其实不仅仅是物联网芯片造成的,而是整个物联网时代是万物互联网,终端越多、链接通路越多,就越容易遭到攻击,尤其是廉价的设备接入其中,很难保证物联网是安全的。 因此物联网芯片就有了更多要求,至少要保证安全。今年年初的熔断和幽灵两大漏洞让 英特尔 、 AMD 在内的半导体公司歹单精竭虑,至今舆论和恐慌还没有完全消退。物联网芯片将会拥有更广阔的市场,一旦出现问题,影响会更加严重。尤其是刚才提到的,针对用户推出的产品种类更多、但单一产品总出货量降低,这就意味着产品后续可能得不到厂商有效的技术支持和维护,给了恶意者可乘之机。如何解决这一问题,也是当前必须解决的。 5G 发展带来更多机会 现如今4G网络已经带来了几十兆甚至上百找兆的贷款速度,高清晰视频在移动过程中都可以完美体验。也正是因为4G网络的普及,才开启了物联网时代。 到了5G时代,速度从量变的积累最终会让我们的生活产生质的变化。原本4G时代,主要是人到终端、互联网到人的通路,而5G网络面对这些游刃有余,还可以物物互联,这就给了物联网以更大的施展空间,物联网芯片也是如此,需要更小的功耗、适应更高速度,保证对应的处理能力。 因此5G的发展将会极大刺激物联网芯片的发展速度,甚至直接影响出货量,预计2020年全球开始逐步向5G网络过渡,而这一时间段也是芯片企业需要关注的关键节点。 虽然国内物联网芯片的发展速度很快,在汽车、手机、智能硬件、家居家电等领域已经有了一些进展,但主要供应商和技术还是靠国外公司,而到2020年时间已经不多了。
  • 《AI与5G大热,芯片半导体行业进入爆发期》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2021-01-19
    • 元旦前后,新洁能、汇顶科技、士兰微、富满电子等多家半导体大厂发布涨价通知函,从而为整个行业涨价提供了注脚。寻根究底,寻求与供应主导着此轮涨价潮。作为高精尖科技的代表,芯片、半导体产业的风吹草动,事关各国国家战略,并吸引了嗅觉灵敏的投资人前赴后继进入芯片、半导体产业,由此,A股芯片板块持续大热的同时,该赛道的投融资热潮也一浪高过一浪。 科技日报记者注意到,企查查大数据研究院日前发布《近十年我国芯片半导体品牌投融资报告》,分析了最近十年来行业投融资变化,以及盘点最受资本青睐的明星企业。 据了解,近十年,整个行业被披露的总融资额超六千亿,并在2017年达到顶峰。 据了解,近十年来,我国芯片半导体赛道共发生投融资事件3169件,总投融资金额超6025亿元。2017年芯片半导体行业共发生投融资总金额2105亿元,为十年来最高峰,其中1500亿元融资被行业巨头紫光集团一举拿下,国资占据主导地位,成绩瞩目。 去年,该行业共发生投融资事件458起,总金额高达1097.69亿元。 2020年,芯片半导体发生投融资事件458起,拿到融资的企业共计392家,总融资金额高达1097.69亿元,最高融资金额被中芯国际拿下,合计198.5亿元,由国家基金一期、国家大基金二期、上海集成电路和国家集成电路共同注资,皆为国资背景。 资料显示,中芯国际是世界领先的集成电路晶圆代工企业之一,也是中国内地规模最大的高科技集成电路晶圆代工企业。 中芯南方、安世半导体以及中兴微电子等企业获得的融资金额同样瞩目。2020年的芯片半导体投融资赛道上,共有16家企业获得总金额超过10亿元融资,其中共计融资事件27起。 科技日报记者注意到,从近十年融资次数TOP10榜单来看,芯原股份以11次稳居榜首,利扬芯片以10次紧随其后。据了解,芯原股份是一家芯片设计平台即服务提供商,为多领域、多种终端提供半导体设计服务。除此之外,地平线机器人、寒武纪等知名品牌的融资次数也榜上有名。 AI与5G仍然是今年的大热门,芯片行业也已进入爆发期,在过去两年都取得了跨越式进展。 值得注意的是,2020年芯片半导体赛道共发生A轮以及pre-A轮融资111起,占比约为24%。从这两年的发展来看,获得融资的企业正在变多,总金额也在逐步扩大,芯片行业的未来让人充满想象。