《人工智能三大驱动力背后的CMOS传感器》

  • 来源专题:光电情报网信息监测服务平台
  • 编译者: husisi
  • 发布时间:2019-11-19
  • 随着人工智能概念逐渐成为科技界最炙手可热的话题,这一依托芯片产业的全新概念牵动了整个科技界的心。依靠政府的大力扶持、潜在市场的巨大规模以及已经逐渐落地的海量应用场景,中国已然成为世界上潜力最大的人工智能市场之一。

    在今年2019世界人工智能大会上,一份《中国人工智能芯片产业发展白皮书》再次引爆了整个科技界。根据白皮书的统计,中国人工智能应用重点集中在安全、金融和商业三大领域,2018年中国人工智能核心产业规模超过900亿元,预计2020年将超过1600亿元。

    而在诸多人工智能应用场景中,图像识别则是最为重要的应用之一。正如清华大学微电子所所长魏少军教授在世界人工智能大会的演讲中所说,数据、算法和算力是人工智能的三大驱动力。而在图像识别应用中,采集图像数据的CMOS图像传感器,又分别在这三大驱动力的背后起到了怎样的重要作用呢?

    一、视觉,人与机器的第一感知

    如果问一个人,最重要的感官是哪个?大部分人的答案一定是——视觉。正如同眼睛为大脑提供了最多的外界感知信息一样,在未来的人工智能应用场景中,CMOS图像传感器也将成为感知层面最重要的传感器。

    人工智能的发展离不开海量的数据,而这些数据中的大部分都是图像数据。因此可以这么说,人工智能应用的崛起就是CMOS图像传感器继移动设备普及之后的第二次爆发机会。我们不妨看看目前人工智能最主要的应用场景,包括人脸识别、自动驾驶、智能家居等,都需要大量的CMOS图像传感器提供图像数据。

    而人工智能丰富的应用场景则会带来多样的问题——低光照、高速运动、功耗限制等,这些问题无一不在考验CMOS厂商的产品开发实力。可以说,海量的数据采集需求为传感器领域带来了巨大的商机,同时也引入了更多全新挑战。而在应对这些挑战的过程中,更注重创新的国内新兴CMOS图像传感器厂商往往比相对保守的国际巨头表现更好。

    二、没有准确的图像数据,何谈深度学习

    谈及图像识别算法,必然绕不开“深度学习”这个概念。图像识别,本质上就是分析图像传感器获得的图像数据,并识别出图像中的待识别物体,因此,图像识别算法的开发至关重要。目前,图像识别算法的开发已经有将近三十年的历史了,从最早的人工特征提取方式,到“深度学习”概念提出后,利用卷积神经网络进行特征提取、分类等操作,再到使用一个网络的端对端模型来完成识别任务,算法开发者们正逐渐地革新算法,从而实现更快的速度、更低的资源消耗、更少的学习成本,乃至达到实时的图像识别。

    正如“看”离不开大脑也离不开眼睛一样,利用深度学习进行图像识别,也离不开“机器眼”——CMOS图像传感器。算法开发者都知道,图像数据中噪点的数量会直接影响最后识别的结果,过多的噪点甚至会导致准确率下降到一个无法承受的程度。同时,由于CMOS成像原理造成的诸如快速运动下的“果冻效应”、像素驱动模式造成的“LED频闪”等诸多成像问题,都会导致深度学习算法无法获得准确的图像数据。

    因此,图像识别算法的革新以及应用的开发,也离不开CMOS图像传感器开发者的努力。正如同眼脑合作才能视物一样,只有CMOS图像传感器和图像识别算法的紧密合作,才能实现真正实用的实时图像识别。

    三、从云端到云边一体再到传感器端运算

    人工智能的物理基础,就是由人工智能芯片组成的算力。而根据《中国人工智能芯片产业发展白皮书》的预测,随着边缘计算的发展和边缘端人工智能芯片的发展,人工智能算力正在经历从云端到云边一体的发展过程。

    云端计算往往聚焦非实时、长周期的大数据分析,而边缘端运算则通过人工智能算法的前置,解放部分云端的计算资源,提高计算效率,增加整体算法的实时性。两者互补,就能同时满足强大运算性能和实时性的要求。因此,业界正在追求云边一体的结合,从而实现更灵活的人工智能算法部署。

    而随着人工智能应用场景的进一步发展,在满足实时性需求时,可能会出现边缘端计算仍然无法应对的情况,这时候就需要将人工智能算法进一步前置,通过传感器端的运算,减轻边缘端算力压力和数据传输带宽压力。虽然这一概念仍然处于初步探索阶段,但已经有国内的CMOS厂商已经开始探索这一概念的可能性了。例如国内安防领域市占率第一的CMOS图像传感器厂商思特威科技,早在今年3月就已正式推出“SmartSensor”AI智能传感器芯片平台的概念。

    四、三大驱动力融合方能塑造人工智能的未来

    无论是数据(感知层)、算法还是算力,目前的产业发展往往还是以单一企业为主体,各个产业链环节的企业各自进行独立的创新,这在产业的新兴阶段往往能通过激烈的竞争诞生不少黑马。但是,随着产业的逐渐发展成熟,未来人工智能产业的发展将以合作为主线,若干个主要的生态系统或者平台将崛起成为行业的核心。

    中国新兴的CMOS图像传感器厂商在这样的生态系统或者平台中,会处于何种地位呢?与拥有产业链优势的国际巨头不同,中国新兴CMOS图像传感器企业往往只专精于CMOS图像传感器领域本身,因此,只有积极参与生态系统和平台的合作中,与整条产业链的各个环节开展紧密的协作,才能在人工智能应用领域诞生出不容忽视的中国力量。

    Arm模式在移动时代的巨大成功已经证明,小而精的企业组成生态系统的商业模式也能取得堪比PC时代巨头垄断模式的成功。那么在下一个人工智能时代,一个融合了数据、算法和算力层面诸多创新企业的生态系统,也拥有美好的前途,而在这其中,CMOS图像传感器企业则将是“必不可少”的配角。

相关报告
  • 《人工智能三大竞争优势》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:冯瑞华
    • 发布时间:2018-06-07
    • 随着物联网、云计算等技术的快速崛起,以及机器学习算法的突破发展,人工智能已经成为当今最热门科研领域之一,并被誉为人类创造的最后一个发明,基将对世界带来颠覆性的变化,同时激发出了种行种业无限的创新机遇。 在2018年中新人工智能高峰论坛上,北京大学访问教授吴霁虹发表了《开创人工智能的“三全”竞争优势》的精采访演讲。作为未来地图Al Bussiness Lab的董事长,吴霁虹认为人工智能今天可以帮助人们延展决策能力,为整个社会带来巨大的效率提升。 那么人工智能到底有什么特别,能给人类的未来带来如此大的影响?吴霁虹从商业竞争的角度诠释了人工智能的三大优势——全智能、全领域、全球化。 全智能赋能人类超级能力 香港有家叫DKL的风投公司,聘请了一个叫做VITAL的机器人董事,VITAL其实就是一个人工智能分析系统,负责给任何一个投资项目提供数据分析,比如说做知识产权的分析,商业竞争对手的分析等。然后,DKL投资机构会根据这些分析结果进行讨论并得出最终的预判。 吴霁虹指出,传统的投资大多数依赖了直觉和经验,这种方式很难实现规模化,而且成功的机率也非常低。有了人工智能以后,我们可以把传统的投资理念变成基于数据、算法和案列等变量管理和分析决策的循环模式。 人类智慧活动的过程,主要是感知、传输、存储、处理、决策、传输到执行的一个循环,而人工智能在这些步骤上基本都超越了人类。利用语音、图像和其它传感器技术,通过云计算、模型训练和机器学习等,AI可以赋予人更加智能的决策判断。 今天人工智能已经可以做到识别、预测、优化、决策、分类、匹配、判断、执行等运算,这些算法将给人们带来更多能力的提升。吴霁虹表示,在商业环境中AI将会比人类更懂用户,谁搞懂了客户需求,谁就掌握了话语权。其次在企业运营上,AI可以更加精准和高效地帮助企业降低成本和提高品质。还有人工智能可以帮资源匹配,令企业的供应链系统更精准、更高效、更优质。 全领域赋能万亿级新经济 人工智能的应用将是无所不在、无所不盖的,基于机器学习的数据分析和决策能为各个行业带来全新的效率和新商机。吴霁虹表示,人工智能的应用可以从我们身边的衣食住行用,延伸到B2B、2C、2D再到2E,其带来可能是万亿级的产业,甚至可能是兆亿级的经济,例如AI+产业的这么一个新经济,可以创造一个巨大的增量。 科大讯飞在2016年之前市值不到100亿,甚至可能是几十亿的规模。但公司在2016年做了全方位的商业化战略部署,今天科大讯飞已经实现了800多亿甚至到1000亿的市值。吴霁虹分析认为,科大讯飞市值背后有B2B、B2C的商业模式,以及AI整个平台开放的支持,可以说今天科大讯飞的商业已经无所不在。 吴霁虹指出,人工智能解决问题的逻辑和我们过去所说的技术解决商业条款逻辑不一样,今天只要你掌握了核心技术,就可以无所不在地解决问题。 西班牙有家传统喜剧院引入了人工智能识别和AI交互系统,看戏观众如果笑一次付3欧元,全程笑只付24欧元,不笑不付钱。吴霁虹表示,AI不仅改变了我们传统的商业逻辑,还改变我们市场。例如安防系统,城市安全、智能化等这样的解决方案。还有今天我们看到的新零售,这些商业的后面是赋能200万家C2B2B2C的商业全新系统。 全球化赋能圈套圈新生态 一个叫理查德的创业者利用芬奇零售驿站实现12到25亿美元的年收入,实际上芬奇零售驿站是人+人工智能的新零售平台,人工智能扮演了合伙人的角色,它帮助理查德打理业务,在30亿用户的电商平台上管理1000多家厂商,大约有200多万种产品,包含了全球各个地方的商家。利用AI可以24小时进行工作服务,理查德获得更多业余时间,可以安排去各地旅游。 人工智能带来的是全球化模式,给企业更多机会,更多的商业生态圈。从商业竞争优势来讲,吴霁虹认为每个地方都有其竞争优势,比如美国有很多的竞争优势。对于中国来说,“一带一路”其实在创造一个全新的竞争优势。今天,南京和新加坡的关系可能就因为科大讯飞的一个技术,能够把它们联结在一起。中国本来是劳动力的输出国,而现在我们也在输出技术。 今天商业人工智能操作系统和过去的商业操作系统是不同的,吴霁虹不赞同用弯道超车来形容,今天弯道超车一定会翻车。就是像公路和飞机的系统一样,今天的人工智能系统在逻辑、规则、技术、架构、材料、运营等等是完全不一样的。吴霁虹还表示,未来我们可能会发生两极分化,要么就是普通人的能力,要么就是获得超级能力的新人类,也就是说新人类和泛人类就是我们面临的未来。
  • 《2018年,人工智能领域仍然有五大难题需要解决》

    • 来源专题:中国科学院文献情报制造与材料知识资源中心 | 领域情报网
    • 编译者:姜山
    • 发布时间:2017-12-29
    • 随着社会上开始遍布类似“终结者”之类机器人的骇人报道,人工智能领域在 2017 年取得了卓越的进步。例如,一个叫做 “冷扑大师”的机器人选手就能让你在扑克游戏里进退两难。而在现实世界中,机器学习正在被用于改善农业产出,或者扩大医疗的覆盖面等诸多领域。 但是,你最近有和你的智能助理 Siri 或者 Alexa 聊过天吗?如果有的话,你就会知道,尽管有很多企业宣传AI 能做很多事,但其实它们仍然有很多不能做或者不能理解人类的部分。在接下来的下一年里,人工智能的专家们还需要解以下五个棘手的问题。 理解我们的语言 实际上,机器从未能如此轻松地处理我们的语言和文字。Facebook 已经做出了可以为视障人士读出图像内容的描述的 AI,而谷歌则能够帮你简洁快速地回复电子邮件。尽管如此,软件仍然不能真正理解我们的语言以及背后的真实语意。其中任务之一是让机器有一定的常识,来理解现实世界。比如,Facebook 的研究人员正在尝试让机器人软件看一些视频来理解现实世界。而其他的研究人员则是让软件用他们对世界的认知来模仿人类的行为。谷歌一直在尝试提升机器学习人类语言学隐喻修辞的能力。Mitchell 已经用相关系统模拟过机器用一些类比修辞和预存的对人类世界的理解来解释照片中的内容。 阻碍机器人革命的现实差距 机器人在硬件方面已经相对成熟了:你可以用 500 美元买一个手掌大小、配备高清摄像头的无人机。同时搬运货物和能用双腿行走的机器人性能也大有改善。然而问题在于为什么现实生活中这些机器人没有参与进来,帮助我们更好地工作?那是因为当今的机器人缺乏协调他们发达四肢的大脑。 实际上,让机器人完成任何具体的任务都需要给他们特定的编程。通过这样,他们可以学习一些操作,比如在多次失败的尝试之后学会抓取特定物体。但是这个学习过程相对较慢。目前一个可行的方法是让机器人在虚拟世界中接受训练,然后把这些数据转移到真实的机器人体内。尽管这个方法困扰于现实中结果的差距---模拟训练过程学习到的技能在现实场景不能总是被有效地运用进来。 幸运的是现实的差距正在逐步缩小,今年十月谷歌的研究人员报道新的进展,他们在试验机器人在模拟和真实场景下拾取不同物体比如胶带座、玩具、梳子等物体。人工智能在自动驾驶汽车领域的进展同样非常重要。那些在自动驾驶汽车领域角逐的公司让虚拟的汽车在模拟的道路上行驶,以此减少在实际路况下测试所花费的时间和金钱开销。 防止 AI 黑客的攻击 那些管理我们电网、摄像头、手机的软件经常会受到各种安全漏洞的困扰。应用于自动驾驶汽车和自主机器人的软件同样会遭受这样的问题。更严重的是,有证据表明有关机器学习的软件因为复杂性的原因反而引入了更多的攻击途径。 今年,有关研究人员指出,他们可以隐藏某个内置于机器学习系统里的触发器,然后让它在接受特定信号的时候变成邪恶模式。来自纽约大学的研究小组设计了一个在通常情况下能够正常运作的街道识别系统,但是该系统的问题在于它一旦识别出黄色的 Post it 标志就会异常运作。如果把黄色便利贴粘到 Brooklyn 街道的一个停车标志上,系统会自动识别并报告这是一个限速标志。这些看似很小缺陷都可能成为自动驾驶汽车的潜在问题。 在本月一个世界知名的机器学习会议上,研究人员们强调了这种潜在威胁的严重性。在会议上他们讨论了机器欺骗的一些可能方法,比如如何生成与人类手写相仿但是对于机器来说截然不同的数字。比如人类会把某个图形看作是数字 2,然而机器视觉系统却把它当做是 3。研究人员也讨论了应对这种攻击可能有效的防御方法,同时也担心人工智能可能会被当做愚弄人类的工具。 人工智能在棋类竞技中脱颖而出 Alphabet 的围棋选手软件在 2017 年发展迅猛。在五月份,更强大的迭代版本在中国打败了围棋冠军。这个 AI 的研究部门 DeepMind 随后又创立了一个叫 AlphaGo Zerod 的版本,它可以在不需要和人类比赛的情况下训练自己。去年 12 月,该部门又一次升级了 AlphaZero,让它先后学会了下象棋和日本将棋。 Alpha Go 的结果令人意外,但同时也限制了人工智能的局限性。因为尽管国际象棋,将棋和围棋都很复杂,但是这些棋类选手都有相对简单的规则和游戏玩法。这表明了它们在未来确实能够很好的胜任的某些人类职务。但是在生活中大多数情况下,问题的结构远远没有那么规整。 这也是为什么 2017 年 DeepMind 和 Facebook 两公司都开始发展能够玩多人制”星际争霸“游戏的人工智能的原因,虽然到目前为止两公司都没有取得长足发展。因为到目前即使是最好的人工智能玩家也难以和中等水平的人类玩家抗衡。DeepMind 的研究人员 Oriol Vinyals 也说,它们的人工智能玩家缺乏规划和记忆的能力。而这些能力恰恰是规划指挥游戏队伍,预测对手行为并且加以应对的关键。此外,这些技能还能让人工智能更好的协同现实工作,比如运用到办公室场景或者军队指挥中去。2018 年人工智能在星际争霸或者类似游戏的巨大进步可能预示着 AI 未来会有更强大广泛的应用。 教会人工智能来明辨是非 即使在上述领域 AI 没有新进展的情况下,如果把现有技术用于经济和社会学领域也同样会带来翻天覆地的变化。然而正当企业和政府正在大力发展 AI 的时候,一些人难免会担心人工智能和机器学习带来的一些意外或者蓄意伤害。 于本月召开的 NIPS 机器学习大会上,如何在安全和道德准则限定下发展科技成为了会议讨论的重要内容之一。研究人员发现,机器学习系统已经可以开始从我们远不完美的世界里获取数据,进而学会了一些例如对性别有刻板映像印象之类的不好的行为。所以现在有人在研究能够监视人工智能系统内部的运作,并保证他们能够在运用到金融或者医疗领域时能公平地发挥作用。 下一年我们应该就能看到科技公司赋予人工智能以人性的光辉。谷歌、Facebook、微软和其他公司已经开始着手这个问题。同时他们都是一个致力于控制人工智能对社会影响的非盈利组织 Partnership 的成员。当然,很多驱动力也来自于外界的独立组织。一个叫做人工智能伦理管理基金会的慈善项目正在支持麻省理工学院,哈佛大学等研究人工智能运用和社会福利的关系。纽约大学的一个叫 AI Now 的新组织也在进行类似研究。在近期的一个报告里,该组织呼吁各国推广使用黑匣子算法以此来保持司法刑事、社会福利领域的隐私性。