《张宏江:人工智能的长远发展需要有人坐冷板凳》

  • 来源专题:数控机床——战略政策
  • 编译者: icad
  • 发布时间:2019-03-28
  • 从金山CEO退休两年后,除了在源码资本任职投资合伙人,张宏江又在北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。   

    从金山CEO退休两年后,除了在源码资本任职投资合伙人,张宏江又在北京智源人工智能研究院担任首届理事长,致力于推动不同行业分享大数据,让从事基础研究院所和 AI 的创业公司更容易获得数据。   

    作为一个横跨产学研、投资四界的人,他对 AI 产业发展无疑有着更全面的了解。近期他接受了 我们的专访,讲述了AI产业投资、AI公司发展和人才培养三方面的内容。     

    谈 AI 投资:投资正趋于理性   

    问:从投资角度,你觉得中国在“智能+”领域投资的短板是什么?   

    张宏江:中国人工智能投资聚焦在应用层,算法、芯片这些基础层的公司与美国相比确实少一些,这跟我们的发展阶段相关,但这会逐渐改善。   

    问:在应用层,你看好哪些“智能+”领域的发展前景?   

    张宏江:我不是应用领域的专家,但发展前景一般与这两点有关:一是应用场景能够产生大数据,二是能够产生很多收入或者它本身就有很大的资源,也就是钱多、数据多的行业,比如金融、医疗和移动互联网。   

    问:钱多、数据多的行业有很大的发展前景,但今年的投融资数据显示,获得最多融资额的是智能制造,这说明了什么?   

    张宏江:应用场景越大,未来所能够影响的市场越大,显然潜力也就越大。我们谈的所有概念都是相对概念,制造业是中国最大的产业,进一步智能化后显然有最大的市场,所以在这个领域吸引到投资是正常的、比较健康的。   

    问:去年年初,李开复等业内人士就预言今年年底寒冬来临,AI 泡沫会破掉,不过投融资数据同样显示,相比去年,今年的 AI 投资事件在数量减少了 1/3,但整个投资的融资额度却增加了将近 1/4,AI 投资的热度似乎不降反升了?   

    张宏江:我们说泡沫破灭还是寒冬来临都是相对概念。换句话说,今天人们看人工智能公司已经不像三年前,钱就会跟着几个从大学出来的博士或者教授,从这一点来说泡沫已经破了。   今天投资额度的增加在于很多钱投到了 B 轮以上的公司,所以(总体投资)数量降低是正常的,这恰恰说明了整个市场趋于成熟,投资也越来越理性,人们对于一家 AI 公司所需要具备的核心竞争力在什么地方也越来越清楚。   另外,关于投资寒冬,其实大家更多看的是经济周期,当经济下行的时候投资一定会变得更加小心。   

    问:如果对 AI 初创企业的创业者们说一句话,你会说什么?   

    张宏江:想清楚自己到底要做什么。第一个问题是你覆盖的用户到底有没有这种需求;第二个问题是有这种需求,你和现在已经在满足他们这种需求的公司有什么核心的差异化。   谈 AI 公司:要形成数据生产的闭环   

    问:你强调 AI 公司的护城河是数据和人才,算法和技术形成不了商业模式,但关键问题是他们如何获得高质量的数据以及正确地使用数据?   

    张宏江:如何获取高质量的数据这个问题今天已经有非常好的答案,这也是为什么这一波AI浪潮能够起来的根本原因之一。20 年前人们做神经网络的时候,并不是完全不知道算法应该怎么往下延伸,而是说那时候根本就没有这么多数据。但尤其过去 10 年移动互联网的快速发展,人和数据有了大量的深度交互,这本身就是产生高质量标注数据的过程。比如用手机拍一张照片,你至少知道是谁在什么地方、什么时候、用哪个手机照的,这些摄像机参数都有,然后就能很容易做场景识别。   同样的道理,我认为未来的人工智能公司一定是所谓的闭环公司,就是说你有产品,产品跟用户进行交互,这个过程中又产生大量反馈去改善产品以及用户体验,吸引更多用户之后,也就能产生更多数据从而训练更好的算法。整体来说是一个循环,尤其是移动互联网的“环”。   所以我不认为产生高质量大数据是个问题,实际上更大的问题是怎么分享不同行业的大数据,怎么让做基础算法研究的人能够用它训练更好的算法,这是核心问题所在。   

    问:既然数据起决定性作用,那是不是可以认为未来没有数据的 AI 公司都会死掉?   

    张宏江:也不能说它会死掉,总归会留下一些AI技术和解决方案 咨询公司,但这些公司很难成为真正的具有领军地位的平台型公司。   问:反过来看,如果现在的大数据公司或者数据平台快速地跟进算法或技术,那他们在未来竞争中应该更有优势。   张宏江:没错,因为今天那些在人工智能上有优势的公司,比如 Google,Facebook,微软,Amazon 的核心在于他们能够获得大量实用场景的数据,当然他们也有很强的技术团队,尤其是 Google 和微软。另外像中国的 BAT、今日头条、美团也一样,他们能够持续获得大量高质量的数据,加上他们本身的技术实力,他们成为人工智能领军企业是毫无疑问的。   

    问:即将举办的 2018 大数据技术大会(BDTC)的演讲议题至少有一半都与人工智能技术强相关,怎么看大数据会议“AI 化”的趋向?   

    张宏江:大数据会议持续举办很多年了,甚至没有因为人工智能的热度把名字给改掉,我感到非常高兴。大数据我们谈了 15 年,但它的应用落地很有限,深度学习算法的突破给大数据的应用提供了强有力工具。在智能化之前,企业首先要先做到数据化,要意识到用数据来驱动业务、驱动产业。所以对于大数据的未来发展,我们应该非常乐观地认识到它是这次产业革命最核心的生产资料,而再利用人工智能这种工具,会找到更好、更多的大数据应用场景。   

    谈 AI 人才:一窝蜂扎堆的方式不可取   

    问:从技术人员角度,你认为 AI 时代需要的优秀人才都有哪些特征?   

    张宏江:任何时代业界对技术人员的要求都是同样的,最核心的是热爱技术,有扎实的技术基础,动手能力极强,只是说 AI 时代可能对人才的技能要求更高,人工智能工程师不只是写程序,还要学会不断开发算法,要有很强的数据分析能力、应用场景的理解能力。   

    问:大学是为企业输送 AI 人才的重要基地,去年以来有一个显著的趋势是至少有 50 家高校的本科都设置了人工智能学院。在人才培养方面你与高校也有交流,你觉得高校培养 AI 人才方面存在哪些误区?   

    张宏江:任何一窝蜂的做法都不可取,尤其是大学都这样做,却不看具体要求。比如我们 15 年前都做软件学院,今天谁告诉我软件学院跟计算机学院的区别?10 年前大家开始开设电商专业,电商专业到底学的是什么?今天人工智能的兴起让我们对人工智能人才的技能要求更多,那我们本科教育应该去加强人工智能课程的设置和质量,让它成为计算机专业方向的侧重方向。你做人工智能专业修不修计算机基础课?要不要懂计算机系统架构?要不要懂计算机基本算法?你前面还要学数学、代数,这些都要做。   所以我看不出今天一窝蜂做人工智能本科专业对这个产业有任何益处。五年以后,如果需要更多芯片人才、网络人才怎么办?10 年前为什么不设 AI 本科专业?我们需要的恰恰是建立起持之以恒的计算机本科教育,强调计算机基础能力,需要课程内容设置更扎实、丰富,包括教材、讲课的内容要不断跟上技术发展的需求。   

    问:另一方面,这么多人工智能学院的成立也说明对 AI 人才的需求很旺盛。   

    张宏江:我没有看到美国排名前 50 的学校一窝蜂地扎堆。过去 30 年人工智能都在坐冷板凳,因为热了再开这个课,那五年以后再坐冷板凳怎么办?我们要的是扎实的本科教育,不是追噱头的一窝蜂。   

    问:美国的 AI 人才教育有什么值得借鉴的地方?   

    张宏江:过去几十年我们一直在向美国学习教育(课程)怎么设置,这种过程应该持续下去,但我们经常学到的是外表或者是一些“时髦”的东西,比如今天大学大多强调的是论文、SC 检索。   我前段时间跟一位院士聊天,聊到在学术上中国人工智能的人才数量已经不少。他说量是比以前增加了很多,但你看看他们在做什么?国际人工智能大会上发表的文章数量已经不少,但这些文章据说 90% 都分布在最热的深度神经网络,就跟设置本科人工智能专业的情形一模一样,这是令人忧虑的。   大家有没有想过今天的神经网络或者深度学习缺陷在哪?它不能解决的问题是什么?这些算法未来的演进是什么?是不是应该在 AI 的其他地方再多做点?我们更应该强调持续的基础研究,真正能够坐很长时间冷板凳的东西。   

    问:你认为目前人们对人工智能行业的发展最需要重视的问题是什么?   

    张宏江:最大的风险是人们认为人工智能只有深度学习或者只有神经网络学习。我们知道每个算法都有它的局限性,如果只考虑一种算法,也应该更多地看一看这种算法的改善空间,这种算法能不能跟其他算法结合,从而应用到更好的应用场景去创造更大的价值。   

    今天人工智能取得的突破都是长期坐冷板凳的结果,下一个突破可能也在于今天坐冷板凳的那些人,希望 AI 的基础研究能够放眼更远的未来。

相关报告
  • 《董景辰:智能制造发展趋势》

    • 来源专题:数控机床——战略政策
    • 编译者:杨芳
    • 发布时间:2016-06-22
    • 一、智能制造内涵 大家都知道“智能制造”是《中国制造2025》的主题方向,虽然现在它的概念很热,但是我想现在还有很多同志对到底什么是智能制造不是特别清楚。所以,今天我首先想介绍一下什么是智能制造。 一是智能制造特征。“智能制造 ”到现在为止,全世界都没有一个准确的定义,学术、产业对“智能制造”的定义不太一样。但是,大家在“智能制造”最主要的特征方面,还是有一定共识的,主要具备如下三个特征:一是感知,要能够获取信息。如果智能制造没有信息,智能便无从谈起。制造过程中有产品信息、工艺信息、制造过程中各种各样的生产流程信息和质量信息,这些信息在“智能制造”领域非常重要;二是智能制造是信息技术和制造技术的结合。智能制造一定是利用了大数据、通信、软件等新的技术和制造技术结合在一起实现的;三是要将数据利用知识进行分析和优化,要能够实现与环境的相适应。这三个条件加在一起可以称为“智能制造”。当前企业中,能够达到智能制造水平的并不多,包括西门子在内,它实现智能制造也需要大约15到20年。在我们国家,如果企业说自身实现了智能制造,还为时过早。我国企业更多的是做到了感知和两化融合,这样的制造我们称之为数字化、网络化制造。 二是智能制造范围。全世界都在研究智能制造范围,我们国家也是这样。我们用一个立方体来表示智能制造的范围:x轴表示产品全生命周期,智能制造从设计、工艺、制造、管理、检验、物流的全部过程中,每一个环节都可以发挥作用,它覆盖了产品全生命周期的所有环节;y轴表示系统层次,包含设备层、生产层、管理层、车间层、企业管理层、协同网络层、制造层,在每一个层次里面,智能制造也有它的作用;z轴表示智能功能,包括互联互通、信息集成等等。这三个维度覆盖了整个智能制造可以适用的范围。 三是智能制造内容。智能制造的内容包含三个方面,分别是智能的产品、智能的制造过程和智能的经营服务方式,三方面内容共同组成了智能制造内容。在这说的智能就是数字化、自动化、网络化、智能化的简称。首先说一下智能产品,智能产品是制造业的标志,也就是说如果说一个产业很强,那这个产业必然有非常好的产品。例如,说高铁很强是因为我国有高速列车。数字技术和信息技术的发展为智能产品提供了创新空间。我举一个例子,大家都知道智能手机的出现把日本的小家电淘汰下去了,手机的出现逐步替代了随身听、录音机、照相机。最近很多企业都在研发无人驾驶汽车,对传统汽车行业更会产生深远影响。智能产品在我们的生活中扮演了重要角色。那么,智能产品有哪些特点呢?一是要有感知作用,即设备本身要有很多自己的特性,质量要好。比如说机床,以前的手摇机床是没有传感器的,后来出现了数控机床,要对移动距离进行测量,就需要传感器。再后来,温度对计算有影响,我们又要测量温度。二是要有获取信息后的自我调节功能,能够使自己处于最佳的工作状态。例如,我测量到温度,我知道温度会测量加工会有影响,就需要温度补偿以保证设备回到初始的测量精度上。还要进行自诊断,能够自动识别什么地方有故障了、电梯电流太大了、电梯发热了等问题。三是要有通讯功能,要能和其他装备和管理系统进行通讯。装备通讯很简单,数控机床配备机械手进行上料,数控机床和机械手之间就需要通讯。数控机床放在制造系统里面,也需要具备通讯功能。四是要对数据进行处理,挖掘分析,提供创造性应用服务。 比如说广东有一家企业,它监测设备的电流,如果电流有毛刺的话,表示轴承安装有问题,通过数据挖掘出新的分析结果,创造出新的价值。第二点,讲一下智能制造过程。智能制造过程包含两部分,一部分是数字化、自动化,是智能制造的基础,追求制造质量和生产效率、减少能耗、降低排放。还有一方面是信息化管理,指生产各个环节间要协调,去掉制造过程中的浪费。数字化管理和信息化、智能化结合在一起的时候才是智能制造过程的全部内容。智能制造过程在各个环节里都可以发挥作用,比如在产品设计环节,过去我们的产品设计是画成图然后把样机加工出来,进行试验发现问题,然后修改图纸,设计周期非常长。在智能化的数字设计领域,可以在虚拟的空间里制造产品模型,在计算机里进行仿真,仿真测试完全达到要求以后可以快速通过物理试验,大大缩短产品设计周期。工艺设计也是这样,一是工艺路线可以在计算机上仿真,例如哪些路线最简洁、最能节省时间;二是当我用某一个数控机床进行加工的时候,可以在计算机上先进行模拟加工,测试精度能不能达到,达标以后再将程序下载到机床里,加工的成功率会非常高,这些都是数字化工艺设计的应用。制造过程的自动化就更多了,包括生产、排产、设备的信息、生产进度信息、现场的可视化、供应链管理等。这个是检验检测,检验检测非常重要,特别是现在大家都讲质量追溯。检验检测的智能化,第一所有的检验检测数据必须是智能填上的,不能手工去填;第二生产线上所有工具的质量都应该是统计出来的,更多的是采用RFID、二维码等,要能够追踪产品生产过程。将来用户在使用过程中出现问题,能够倒追产品哪个工序、哪个工位,甚至是哪一批元器件造成的,这是质量信息方面。再一个是能源管理,我国的能耗跟世界平均水平相比差距较大,单位GDP大概是全球三倍。能源管理里面对主要的高耗能设备要进行可视化的管理,而且产量与能耗之间的关系应该搞清楚,这样就能建立各个重点环节的节能模型。最后是智能物流,这里的物流是指车间内的物流。其实,物流是目前智能化改造之后节约效应最明显的领域,能够大量减少人力、大大提高物流效率,降低物流过程中的质量损耗。可以利用电子单证、RFID等物联网技术,对物品的流动进行定位、跟踪、控制,还有立体仓库的控制等等。我也举一些例子,这是德国公司的模拟生产,在计算机上仿真生产流程,通过模拟对人工的制造资源进行优化配置。这个是西门子与玛莎拉蒂的汽车制造厂,它能够模拟产品整个生命周期的数字化和各个环节的协同,并能完全模拟生产流程。如果生产环境变化,比如原材料、物流有了变化或者供应链没有过来对供应链产生的影响,在计算机里都可以体现。在我们国家的飞机制造领域,数字化设计应用非常多。采用数字化设计以后,飞机可以做到一次装配成功、一次试飞成功。 数字化车间能够实现设备和设备、人和设备在工厂和后台的互联互通。例如海尔工厂,用户下了订单以后,可以在自己手机上看到我所下的订单的冰箱现在在哪个生产线上,到哪一工位,什么时候可以交货,这是数字化车间的典型案例在我们国家的实行。下面讲一下制造过程的智能化,主要讲精益模式的智能化。精益模式的智能化我们主要讲三个方面:一是个性化定制,红领在这方面做得非常好。个性化定制有几个条件,一是产品必须是模块化的,个性化定制并不是每一个产品都从头设计,一定是把产品模块化。经过模块化之后,将符合不同要求的不同模块组合在一起就形成个性化的产品。二是一定要有服务平台,通过服务平台用户可以根据深入的交互让用户选用模块,快速生成产品的定制方案。三是定制完成后,后续的生产要跟得上。生产计划和制造线能够跟得上订单需求,这是很不容易的。符合这三个条件才可以称为个性化定制。首先介绍一下个性化定制,例如奥迪将零件压缩之后形成重点模块,模块可以组合成更多的产品,这是模块化的生产方式。奥迪表示自己有20000多个部件,可以形成10000种产品,为30万用户提供特殊需求。我们国家在这方面的案例就是红领,大家可以看到红领的成绩非常明显,可以采集身上18个部位22个数据,根据这些数据顾客就可以形成他独有的订单,这样的设计7天就可以交付,成本只比批量生产高10%,通过这样的个性化定制,红领的年销售收入和利润增长都超过100%。所以说,个性化定制这样一种智能制造方式能够为企业带来效益。第二种方式是协同开放云制造,协同开放云制造什么意思呢?我建立一个网络平台,在网络平台里可以对不同企业或企业不同部门的创新资源、设计能力、生产能力、服务能力进行集成和对接,此外,还可以和社会上的资源和服务进行对接。目前,协同制造应用最好的领域是航空工业,航空工业本身的特点导致其必须采用协同制造。比如,沈飞坐飞机的头、成飞做机翼、西飞做的机身,肯定是不同的地区、不同的厂家在进行协同的运行设计,设计完成后要到一个地方装配,这样就必须采用协同开放云制造这样的方式才能够实现。经营模式里面,我们推荐远程监控。 远程监控就是说我们利用工业物联网,把我卖出去的产品的设备状态、操作情况、环境情况进行搜集,将数据上传运维平台进行管理,向用户提供在线监测、故障预计等预测性服务方案,此外,还配备了专家团队对远程监控提供支持,如果普通方案不能满足要求的时候,还可以请专家团队过来提出新方案。像陕西鼓风机,每卖一台鼓风机就配备一套测试装备,它在全国设有3个远程监控点为用户服务。这方面做的最漂亮的是GE公司,GE公司将传感器装在发动机的叶面上,并测试发动机叶面参数,从飞机滑行开始,将滑行、起飞、巡航、下降、遇到不同的天气波动等所有情况下的测试参数全部归纳起来,对发动机的状态进行监控,检查、判断发动机是否正常,如果有问题是哪个部件出了问题,飞机还没到达机场就将部件准备好,飞机降落之后马上把部件换上去。由于GE能够提供这种服务,后来它就不卖发动机了,只卖飞行小时,航空公司租GE的发动机,以飞行小时计价,这样的方式使得GE公司去年的业务量从69亿/年增加到187亿/年,该项业务的收入从占到总收入的40%增加到60%,现在全世界的发动机公司都在学习GE的做法。 二、发展形势 以上我将智能制造内涵大致介绍了一下,下面再抽5分钟时间把发展形势说一下。 一是我国智能制造需求旺盛。我们国家从2011年开始推行“智能制造”,当时大家觉得“智能制造”离我们太远了。但是,经过这几点的发展,大家觉得“智能制造”很快就来到了我们跟前。2011年到2014年,发改委、工信部、财政部联合实施了智能制造专项,4年共支持了124个项目,投入经费40亿元。2015年,国家又选出了46个国家试点示范项目,分布在28个省市、36个行业。而且,我国也实施了智能制造专项,其中标准研制43项、数字化车间51项,国家共投资10个亿。通过这几年的努力,我们给企业指出的方向,带动了企业对智能制造的需求,另外,关键的零部件和智能制造装备方面也取得了巨大的进展。数字化车间、数字化工厂的建设也在点上取得了一些突破,有了样板,并培训了一批人才。而且我们形成了一种机制,就是用户和制造商联合实施智能制造项目,这些都是有益的探索。经过这四年,可以说我们国家智能制造的培训期已经过了,从现在开始我们进入发展期。现在,我们国家智能制造需求非常旺盛。2014年,我们对浙江省10个市、20个行业、116家企业进行了调研,在机器换人需求方面,64.2%的企业非常强烈,44.9%的企业一般,14%的企业表示在做准备,真正没有需求的企业只占2%。此外,他们需求的目的非常明确,82%是为了解决人工问题,71.9%是为了解决劳动时间问题,71.9%是为了解决生产问题效率问题,还有46%是为了解决环境问题。浙江省每年在推进数字化、网络化、智能化战略方面政府和企业总投资要达到3600亿到5000亿之间。2015年,我们对福建省做了一项调查,100%的企业都对智能制造需求非常强烈,其中,家居行业需要升级的占32%,装备行业需要升级的站25%,监测环节需要升级的占32%,测试环节需要升级的占28%,物流、搬运、体力劳动升级的占23%。2015年,东莞机器换人已经达到1262个项目,总投资超过100亿,而且力争三年要达到80%的企业实现机器换人。江苏、广州、浙江等企业,三省每年在智能制造投入方面投资达到1万亿,占全国总投资的20%以上。 二是我国智能制造供应不足。虽然智能制造需求旺盛,但是我们国家的供应不足。我们国家的装备制造业现在是70%依赖进口,过程装备应用比率不到30%。根据世界银行的统计,我国每年进口的装备达到2万亿台发动机,这样的情况导致过程装备在市场上的占有率大概只有42%,不到一半,进口率达到58%,高端装备进口的比率会更大。因此,我国的整个市场从需求上分析,市场需求量非常大,2013年是3.5万亿到5万亿,我们预计2020年是8万亿到10万亿。这么大的市场肯定要成为我国“十三五”期间经济发展新的增长点。从供给侧来看,我国国内装备不到一半,一半以上需要进口。因此,我们必须发展我们自己国产的装备制造业,用中国装备装备中国制造,应该成为“中国制造2025”的重要核心战略。 三、关注的问题 最后关注几个问题。一是从国家层面来看,我们在促进智能制造和装备制造应该同步发展,要防止智能制造出现“空心化”,不能我们的数字化水平很高,但打开一看里面的装备全部都是国外的、机器人全部是西门子的,这样的情况不是我们想看到的。二是我们要做好三大基础,分别是标准化、基础设施和网络安全、软件,我国在这三方面还需要大大加强。三是人才培养,我国现在及其缺乏综合的智能制造方面人才,特别是系统集成,国家应该今后在这方面加强。今年,智能制造专项在实施过程中也都体现了这些思想。那么,作为企业来说,在发展智能制造过程中应注意哪些问题呢?首先,智能制造是要有基础的。现在想要实施智能制造的企业必须要管好自身基础,做实基础,包括精益生产、质量管理、劳动生产率等。北航有个老师说过三句话,我觉的很好:“不在落后的工业基础上搞自动化,不在落后的管理基础上搞信息化,不要在没有数字化、网络化的基础上搞智能制造”。所以,企业在实施智能制造的时候首先要关注自身基础。二是企业搞智能制造、搞数字化车间要有明确的经济目标,不要盲目追求高大上,不是为智能制造而智能制造,一定要关注投资汇报周期。在南方,一般企业家一年投资回收周期一定干,两年投资回收可以干,三年以上投资回收周期基本就不干了。三是智能制造不会一次就成功,不要希望投资一次就把智能制造搞起来,一定是分批分阶段,一步步提高的。
  • 《核心算法缺位 人工智能发展面临“卡脖子”窘境》

    • 来源专题:数控机床——前沿技术
    • 编译者:icad
    • 发布时间:2019-06-17
    • “中国有多少数学家投入到人工智能的基础算法研究中?”日前,在上海召开的院士沙龙活动中,中国工程院院士徐匡迪等多位院士的发问引发业界共鸣,被称为“徐匡迪之问”。“我国人工智能领域真正搞算法的科学家凤毛麟角。”在4月28日召开的“超声大数据与人工智能应用与推广大会”上,东南大学生物科学与医学工程学院教授万遂人表示,“徐匡迪之问”直击我国人工智能发展的核心关键问题,“如果这种情况不改变,我国人工智能应用很难走向深入、也很难获得重大成果”。 我国人工智能领域发展的现状如何?依靠开源代码和算法是否足够支撑人工智能产业发展?为什么要有自己的底层框架和核心算法?缺少核心算法,会被“卡脖子”“如果缺少核心算法,当碰到关键性问题时,还是会被人‘卡脖子’。”浙江大学应用数学研究所所长孔德兴教授对科技日报记者表示,我国人工智能产业的创新能力并没有传说中的那样强,事实是,产业发展过度依赖开源代码和现有数学模型,真正属于中国自己的东西并不多。 4个月零基础学会人工智能、16讲入门人工智能、算法线下大课……类似培训在网络上非常火爆,通过对于现有算法、模型的学习和训练,成长为人工智能工程师的“短平快”可见一斑。既然代码是开源的,拿来用就好,为什么还有可能被“卡脖子”?孔德兴解释,开源代码是可以拿过来使用,但专业性、针对性不够,效果往往不能满足具体任务的实际要求。以图像识别为例,用开源代码开发出的AI即使可以准确识别人脸,但在对医学影像的识别上却难以达到临床要求。 “例如对肝脏病灶的识别,由于边界模糊、对比度低、器官黏连甚至重叠等困难,用开源代码很难做到精准识别。在三维重构、可视化等方面难以做到精准反应真实的解剖信息,甚至会出现误导等问题,这在医学应用上是‘致命’的。”“碰到专业性高的研究任务,一旦被‘卡脖子’将会是非常被动的,所以一定要有自己的算法。”孔德兴说。 换句话说,是否掌握核心代码将决定未来的AI“智力大比拼”中是否拥有胜算。用开源代码“调教”出的AI顶多是个“常人”,而要帮助AI成长为“细分领域专家”,需以数学为基础的原始核心模型、代码和框架创新。有算法之“根”才能撑起产业“繁茂”所谓“树大根深”,人工智能的发展也是同样道理,越在底层深深扎下根基,越能够发展出强大的产业。 借助开源代码,“半路出家”的AI产业为什么会难以为继?孔德兴解释说,在获得同样数据的前提下,以开源代码运行,AI深度学习之后或许能输出结果,但由于训练框架固定、算法限制,当用户进行具体的实际应用时,将很难达到所期望的结果,而且难以修改、完善、优化算法。“如果从底层算法做起,那么整个数学模型、整个算法设计、整个模拟训练‘一脉相承’,不仅可以协同优化,而且可以根据需求随时修改,从而真正解决实际问题。” 孔德兴说,基础算法往往是指研究共性问题的算法,它涉及到基础数学理论、高性能数值计算等学科,可以应用到多种实际问题中;而针对性强的应用算法往往会应用到具体问题所涉及的“具体知识、先验信息”,从而更好地解决实际应用问题。“基础算法和应用算法都很重要,拥有基础算法将更有助于应用算法的丰富与深入。”孔德兴说,AI要应对的现实生活是复杂、多变的,当能够“应对自如”时,才能够促成产业的“繁茂”。 呼吁三方协力,让数学不再置身事外“一方面是政策引导,其实国家已经在加大这方面的扶持,例如科研基金上的设置等。”针对如何解决“徐匡迪之问”反映出来的问题,孔德兴认为,第二方面是行业企业在进行科技创新时,应有意识将数学学者纳入进来。“如果通过算法的开发,最终产品落地了,企业应该将算法开发时的数学学者纳入到成果分享中来。”孔德兴说,社会目前对于数学科学等“软实力”的认可程度不足,行业或法规层面应该做好数学研究成果的产权保护工作。“第三方面,数学家本身应该积极参与到人工智能发展的浪潮里。”孔德兴呼吁,AI的未来发展需要数学家深度参与。由于目前仍处于“弱人工智能”时代(可以说是数据智能时代),AI的实现主要是依赖计算机的巨大算力和巨大的存储能力,底层算法的问题或许并不突出,但在未来的发展,AI将可能融入逻辑、思维等智慧的内容,这些都需要数学科学的原始创新,有大量的基础问题亟待数学家攻克。 算法的进阶一定是来源于“原创者”,而不是“跟随者”。孔德兴说:“实际上深度学习的应用已遇到了天花板,我们需要新的数学技术(如部分依赖逻辑、部分依赖数据的‘聪明算法’),让计算机变得聪明起来。这些工作都需要数学家的参与。”.