《核心算法缺位 人工智能发展面临“卡脖子”窘境》

  • 来源专题:数控机床——前沿技术
  • 编译者: icad
  • 发布时间:2019-06-17
  • “中国有多少数学家投入到人工智能的基础算法研究中?”日前,在上海召开的院士沙龙活动中,中国工程院院士徐匡迪等多位院士的发问引发业界共鸣,被称为“徐匡迪之问”。“我国人工智能领域真正搞算法的科学家凤毛麟角。”在4月28日召开的“超声大数据与人工智能应用与推广大会”上,东南大学生物科学与医学工程学院教授万遂人表示,“徐匡迪之问”直击我国人工智能发展的核心关键问题,“如果这种情况不改变,我国人工智能应用很难走向深入、也很难获得重大成果”。

    我国人工智能领域发展的现状如何?依靠开源代码和算法是否足够支撑人工智能产业发展?为什么要有自己的底层框架和核心算法?缺少核心算法,会被“卡脖子”“如果缺少核心算法,当碰到关键性问题时,还是会被人‘卡脖子’。”浙江大学应用数学研究所所长孔德兴教授对科技日报记者表示,我国人工智能产业的创新能力并没有传说中的那样强,事实是,产业发展过度依赖开源代码和现有数学模型,真正属于中国自己的东西并不多。

    4个月零基础学会人工智能、16讲入门人工智能、算法线下大课……类似培训在网络上非常火爆,通过对于现有算法、模型的学习和训练,成长为人工智能工程师的“短平快”可见一斑。既然代码是开源的,拿来用就好,为什么还有可能被“卡脖子”?孔德兴解释,开源代码是可以拿过来使用,但专业性、针对性不够,效果往往不能满足具体任务的实际要求。以图像识别为例,用开源代码开发出的AI即使可以准确识别人脸,但在对医学影像的识别上却难以达到临床要求。

    “例如对肝脏病灶的识别,由于边界模糊、对比度低、器官黏连甚至重叠等困难,用开源代码很难做到精准识别。在三维重构、可视化等方面难以做到精准反应真实的解剖信息,甚至会出现误导等问题,这在医学应用上是‘致命’的。”“碰到专业性高的研究任务,一旦被‘卡脖子’将会是非常被动的,所以一定要有自己的算法。”孔德兴说。

    换句话说,是否掌握核心代码将决定未来的AI“智力大比拼”中是否拥有胜算。用开源代码“调教”出的AI顶多是个“常人”,而要帮助AI成长为“细分领域专家”,需以数学为基础的原始核心模型、代码和框架创新。有算法之“根”才能撑起产业“繁茂”所谓“树大根深”,人工智能的发展也是同样道理,越在底层深深扎下根基,越能够发展出强大的产业。

    借助开源代码,“半路出家”的AI产业为什么会难以为继?孔德兴解释说,在获得同样数据的前提下,以开源代码运行,AI深度学习之后或许能输出结果,但由于训练框架固定、算法限制,当用户进行具体的实际应用时,将很难达到所期望的结果,而且难以修改、完善、优化算法。“如果从底层算法做起,那么整个数学模型、整个算法设计、整个模拟训练‘一脉相承’,不仅可以协同优化,而且可以根据需求随时修改,从而真正解决实际问题。”

    孔德兴说,基础算法往往是指研究共性问题的算法,它涉及到基础数学理论、高性能数值计算等学科,可以应用到多种实际问题中;而针对性强的应用算法往往会应用到具体问题所涉及的“具体知识、先验信息”,从而更好地解决实际应用问题。“基础算法和应用算法都很重要,拥有基础算法将更有助于应用算法的丰富与深入。”孔德兴说,AI要应对的现实生活是复杂、多变的,当能够“应对自如”时,才能够促成产业的“繁茂”。

    呼吁三方协力,让数学不再置身事外“一方面是政策引导,其实国家已经在加大这方面的扶持,例如科研基金上的设置等。”针对如何解决“徐匡迪之问”反映出来的问题,孔德兴认为,第二方面是行业企业在进行科技创新时,应有意识将数学学者纳入进来。“如果通过算法的开发,最终产品落地了,企业应该将算法开发时的数学学者纳入到成果分享中来。”孔德兴说,社会目前对于数学科学等“软实力”的认可程度不足,行业或法规层面应该做好数学研究成果的产权保护工作。“第三方面,数学家本身应该积极参与到人工智能发展的浪潮里。”孔德兴呼吁,AI的未来发展需要数学家深度参与。由于目前仍处于“弱人工智能”时代(可以说是数据智能时代),AI的实现主要是依赖计算机的巨大算力和巨大的存储能力,底层算法的问题或许并不突出,但在未来的发展,AI将可能融入逻辑、思维等智慧的内容,这些都需要数学科学的原始创新,有大量的基础问题亟待数学家攻克。

    算法的进阶一定是来源于“原创者”,而不是“跟随者”。孔德兴说:“实际上深度学习的应用已遇到了天花板,我们需要新的数学技术(如部分依赖逻辑、部分依赖数据的‘聪明算法’),让计算机变得聪明起来。这些工作都需要数学家的参与。”.

相关报告
  • 《基于新一代人工智能发展中国智能制造》

    • 来源专题:数控机床——战略政策
    • 编译者:杨芳
    • 发布时间:2017-09-25
    • 导读: 为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,国务院印发了《新一代人工智能发展规划》,从战略态势、总体要求、重点任务、资源配置、保障措施和组织实施等方面明确规划了我国新一代人工智能的发展蓝图。 当前,正在发生重大变革的信息新环境和人类社会发展的新目标正推动人工智能发展进入新阶段,并深刻改变人类社会生活、改变世界。为抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国,国务院印发了《新一代人工智能发展规划》,从战略态势、总体要求、重点任务、资源配置、保障措施和组织实施等方面明确规划了我国新一代人工智能的发展蓝图。 特别是,在规划重点任务的“加快推进产业智能化升级”一节中,对发展我国“智能制造”提出:“围绕制造强国重大需求,推进智能制造关键技术装备、核心支撑软件、工业互联网等系统集成应用,研发智能产品及智能互联产品、智能制造使能工具与系统、智能制造云服务平台,推广流程智能制造、离散智能制造、网络化协同制造、远程诊断与运维服务等新型制造模式,建立智能制造标准体系,推进制造全生命周期活动智能化”。 上述规划内容明确指出了基于新一代人工能技术发展我国智能制造的实现要点: 1、要围绕制造强国重大需求,协调推进基于新一代人工智能技术的智能制造的技术、产业和应用发展。 从总体上讲,我国制造业正面临加快推进“五个转型”(由要素驱动向创新驱动战略转型、传统制造向数字化网络化智能化制造转型、由粗放型制造向质量效益型制造转型、由资源消耗型、环境污染型制造向绿色制造转型、由生产型制造向生产+服务型制造转型)的严峻挑战。我国智能制造的技术、产业和应用等方面还处于起步阶段。所以,需要贯彻“创新、协调、绿色、开放、共享”的发展理念,以创新发展为主题,以促进制造业提高质量增加效益为中心,以加快新一代人工智能技术与制造业深度融合为主线,协调发展自主的智能制造技术、产业和应用,通过30年/3个阶段的努力奋斗,实现从制造大国发展为制造先进强国的宏伟战略目标。 2、要基于新一代人工智能技术,推进智能制造技术的集成应用及其制造模式。 要部署实施一批跨企业(行业/区域)、企业级、车间级和制造单元级等不同层次智能制造系统的构建与应用示范,推进基于新一代人工智能技术的智能制造关键技术装备、核心支撑软件、工业互联网等系统集成应用,推广流程智能制造、离散智能制造、网络化协同制造、远程诊断与运维服务等新型制造模式。 3、要基于新一代人工智能技术,推进制造全生命周期活动的智能化。 要围绕离散制造全生生命周期活动的智能化发展需求,部署实施基于工业互联网群体智能的个性化创新设计、协同研发群智空间、智能云生产、智能协同保障与供应营销服务链等应用示范;围绕流程制造全过程、全流程活动的智能化发展需求,部署实施基于新一代人工智能技术的流程工业智能感知、智能建模、智能控制、智能优化与智能运维等应用示范;围绕我国创新驱动发展战略和提升我国制造业自主设计创新能力的重大需求,部署实施服务于从概念创意到研发、生产、试验、服务等全产业链的大数据智能创新设计和群智众创设计等典型示范。 4、要加快建立和发展基于新一代人工智能技术的我国自主的智能制造技术、标准、使能产品和系统运营等产业。 要融合新一代人工智能技术与制造技术,研究突破智能制造系统总体技术架构、智能化制造服务的商业模式、智能管控的集成互联技术、智能制造安全与评估体系和智能制造标准体系等智能制造系统总体技术;研究突破面向智能制造大数据的网络互连技术、智能资源/能力感知和物联技术、智能资源/能力虚拟化和服务化技术、智能服务环境的构建/管理/运行/评估技术、智能知识/模型/大数据管理分析与挖掘技术、人机共融智能交互技术等智能制造系统平台技术;研究突破智能设计、智能生产、智能管理、智能试验、智能保障等制造全生命周期活动智能化和全过程、全流程智能化等关键技术;进而建立相关的标准体系。 要围绕“中国制造2025”提出的十大重点应用领域,融合新一代人工智能技术,研发智能产品(能够自主智慧地完成本身任务的产品)及智能互联产品(能够形成互联生态的智能产品);研发系统软件、平台软件、应用软件等智能工业软件,以及智能材料、智能传感器、智能机床、智能工业机器人、智能3D打印机等支撑智能设计/生产/管理/试验/保障的硬软件使能工具;研发不同层次智能制造系统构建与运营的技术与工具;进而形成我国自主的智能制造产业体系。 我们坚信在规划的指引下,在举国上下的齐心努力下,基于新一代人工能技术发展中国的智能制造必将加快实现我国从制造大国迈向制造强国的宏伟战略目标。.
  • 《张宏江:人工智能的长远发展需要有人坐冷板凳》

    • 来源专题:数控机床——战略政策
    • 编译者:icad
    • 发布时间:2019-03-28
    • 从金山CEO退休两年后,除了在源码资本任职投资合伙人,张宏江又在北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。    从金山CEO退休两年后,除了在源码资本任职投资合伙人,张宏江又在北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。    作为一个横跨产学研、投资四界的人,他对 AI 产业发展无疑有着更全面的了解。近期他接受了 我们的专访,讲述了AI产业投资、AI公司发展和人才培养三方面的内容。      谈 AI 投资:投资正趋于理性    问:从投资角度,你觉得中国在“智能+”领域投资的短板是什么?    张宏江:中国人工智能投资聚焦在应用层,算法、芯片这些基础层的公司与美国相比确实少一些,这跟我们的发展阶段相关,但这会逐渐改善。    问:在应用层,你看好哪些“智能+”领域的发展前景?    张宏江:我不是应用领域的专家,但发展前景一般与这两点有关:一是应用场景能够产生大数据,二是能够产生很多收入或者它本身就有很大的资源,也就是钱多、数据多的行业,比如金融、医疗和移动互联网。    问:钱多、数据多的行业有很大的发展前景,但今年的投融资数据显示,获得最多融资额的是智能制造,这说明了什么?    张宏江:应用场景越大,未来所能够影响的市场越大,显然潜力也就越大。我们谈的所有概念都是相对概念,制造业是中国最大的产业,进一步智能化后显然有最大的市场,所以在这个领域吸引到投资是正常的、比较健康的。    问:去年年初,李开复等业内人士就预言今年年底寒冬来临,AI 泡沫会破掉,不过投融资数据同样显示,相比去年,今年的 AI 投资事件在数量减少了 1/3,但整个投资的融资额度却增加了将近 1/4,AI 投资的热度似乎不降反升了?    张宏江:我们说泡沫破灭还是寒冬来临都是相对概念。换句话说,今天人们看人工智能公司已经不像三年前,钱就会跟着几个从大学出来的博士或者教授,从这一点来说泡沫已经破了。   今天投资额度的增加在于很多钱投到了 B 轮以上的公司,所以(总体投资)数量降低是正常的,这恰恰说明了整个市场趋于成熟,投资也越来越理性,人们对于一家 AI 公司所需要具备的核心竞争力在什么地方也越来越清楚。   另外,关于投资寒冬,其实大家更多看的是经济周期,当经济下行的时候投资一定会变得更加小心。    问:如果对 AI 初创企业的创业者们说一句话,你会说什么?    张宏江:想清楚自己到底要做什么。第一个问题是你覆盖的用户到底有没有这种需求;第二个问题是有这种需求,你和现在已经在满足他们这种需求的公司有什么核心的差异化。   谈 AI 公司:要形成数据生产的闭环    问:你强调 AI 公司的护城河是数据和人才,算法和技术形成不了商业模式,但关键问题是他们如何获得高质量的数据以及正确地使用数据?    张宏江:如何获取高质量的数据这个问题今天已经有非常好的答案,这也是为什么这一波AI浪潮能够起来的根本原因之一。20 年前人们做神经网络的时候,并不是完全不知道算法应该怎么往下延伸,而是说那时候根本就没有这么多数据。但尤其过去 10 年移动互联网的快速发展,人和数据有了大量的深度交互,这本身就是产生高质量标注数据的过程。比如用手机拍一张照片,你至少知道是谁在什么地方、什么时候、用哪个手机照的,这些摄像机参数都有,然后就能很容易做场景识别。   同样的道理,我认为未来的人工智能公司一定是所谓的闭环公司,就是说你有产品,产品跟用户进行交互,这个过程中又产生大量反馈去改善产品以及用户体验,吸引更多用户之后,也就能产生更多数据从而训练更好的算法。整体来说是一个循环,尤其是移动互联网的“环”。   所以我不认为产生高质量大数据是个问题,实际上更大的问题是怎么分享不同行业的大数据,怎么让做基础算法研究的人能够用它训练更好的算法,这是核心问题所在。    问:既然数据起决定性作用,那是不是可以认为未来没有数据的 AI 公司都会死掉?    张宏江:也不能说它会死掉,总归会留下一些AI技术和解决方案 咨询公司,但这些公司很难成为真正的具有领军地位的平台型公司。   问:反过来看,如果现在的大数据公司或者数据平台快速地跟进算法或技术,那他们在未来竞争中应该更有优势。   张宏江:没错,因为今天那些在人工智能上有优势的公司,比如 Google,Facebook,微软,Amazon 的核心在于他们能够获得大量实用场景的数据,当然他们也有很强的技术团队,尤其是 Google 和微软。另外像中国的 BAT、今日头条、美团也一样,他们能够持续获得大量高质量的数据,加上他们本身的技术实力,他们成为人工智能领军企业是毫无疑问的。    问:即将举办的 2018 大数据技术大会(BDTC)的演讲议题至少有一半都与人工智能技术强相关,怎么看大数据会议“AI 化”的趋向?    张宏江:大数据会议持续举办很多年了,甚至没有因为人工智能的热度把名字给改掉,我感到非常高兴。大数据我们谈了 15 年,但它的应用落地很有限,深度学习算法的突破给大数据的应用提供了强有力工具。在智能化之前,企业首先要先做到数据化,要意识到用数据来驱动业务、驱动产业。所以对于大数据的未来发展,我们应该非常乐观地认识到它是这次产业革命最核心的生产资料,而再利用人工智能这种工具,会找到更好、更多的大数据应用场景。    谈 AI 人才:一窝蜂扎堆的方式不可取    问:从技术人员角度,你认为 AI 时代需要的优秀人才都有哪些特征?    张宏江:任何时代业界对技术人员的要求都是同样的,最核心的是热爱技术,有扎实的技术基础,动手能力极强,只是说 AI 时代可能对人才的技能要求更高,人工智能工程师不只是写程序,还要学会不断开发算法,要有很强的数据分析能力、应用场景的理解能力。    问:大学是为企业输送 AI 人才的重要基地,去年以来有一个显著的趋势是至少有 50 家高校的本科都设置了人工智能学院。在人才培养方面你与高校也有交流,你觉得高校培养 AI 人才方面存在哪些误区?    张宏江:任何一窝蜂的做法都不可取,尤其是大学都这样做,却不看具体要求。比如我们 15 年前都做软件学院,今天谁告诉我软件学院跟计算机学院的区别?10 年前大家开始开设电商专业,电商专业到底学的是什么?今天人工智能的兴起让我们对人工智能人才的技能要求更多,那我们本科教育应该去加强人工智能课程的设置和质量,让它成为计算机专业方向的侧重方向。你做人工智能专业修不修计算机基础课?要不要懂计算机系统架构?要不要懂计算机基本算法?你前面还要学数学、代数,这些都要做。   所以我看不出今天一窝蜂做人工智能本科专业对这个产业有任何益处。五年以后,如果需要更多芯片人才、网络人才怎么办?10 年前为什么不设 AI 本科专业?我们需要的恰恰是建立起持之以恒的计算机本科教育,强调计算机基础能力,需要课程内容设置更扎实、丰富,包括教材、讲课的内容要不断跟上技术发展的需求。    问:另一方面,这么多人工智能学院的成立也说明对 AI 人才的需求很旺盛。    张宏江:我没有看到美国排名前 50 的学校一窝蜂地扎堆。过去 30 年人工智能都在坐冷板凳,因为热了再开这个课,那五年以后再坐冷板凳怎么办?我们要的是扎实的本科教育,不是追噱头的一窝蜂。    问:美国的 AI 人才教育有什么值得借鉴的地方?    张宏江:过去几十年我们一直在向美国学习教育(课程)怎么设置,这种过程应该持续下去,但我们经常学到的是外表或者是一些“时髦”的东西,比如今天大学大多强调的是论文、SC 检索。   我前段时间跟一位院士聊天,聊到在学术上中国人工智能的人才数量已经不少。他说量是比以前增加了很多,但你看看他们在做什么?国际人工智能大会上发表的文章数量已经不少,但这些文章据说 90% 都分布在最热的深度神经网络,就跟设置本科人工智能专业的情形一模一样,这是令人忧虑的。   大家有没有想过今天的神经网络或者深度学习缺陷在哪?它不能解决的问题是什么?这些算法未来的演进是什么?是不是应该在 AI 的其他地方再多做点?我们更应该强调持续的基础研究,真正能够坐很长时间冷板凳的东西。    问:你认为目前人们对人工智能行业的发展最需要重视的问题是什么?    张宏江:最大的风险是人们认为人工智能只有深度学习或者只有神经网络学习。我们知道每个算法都有它的局限性,如果只考虑一种算法,也应该更多地看一看这种算法的改善空间,这种算法能不能跟其他算法结合,从而应用到更好的应用场景去创造更大的价值。    今天人工智能取得的突破都是长期坐冷板凳的结果,下一个突破可能也在于今天坐冷板凳的那些人,希望 AI 的基础研究能够放眼更远的未来。