《院士专家解读大数据AI如何抗“疫”》

  • 来源专题:光电情报网信息监测服务平台
  • 编译者: husisi
  • 发布时间:2020-08-03
  • 7月30日,北京市政府新闻办举行发布会,发布第二批30项应用场景建设项目。其中,面向城市管理,提升城市精细化管理水平,推动技术服务疫情防控是重要方面。

    实际上,自6月11日新发地发生聚集性疫情,到7月20日,仅仅34天,北京新冠肺炎疫情防控从二级调至三级。首都安澜,大数据人工智能(AI)技术功不可没。

    专家认为,超大型国际化大都市利用大数据快速锁定病例行动轨迹,圈定密切接触者等高风险人群,对于预警管控、迅速切断传播渠道至关重要。

    那么,大数据人工智能是如何“参战”并在战“疫”中守护隐私的,对于不断突发的“疫情”,如何能做得更好?

    精准画像 “一个都不能少”

    自新冠肺炎疫情发生以来,北京AI疫情追踪项目迅速启动,中国人民大学高瓴人工智能学院院长文继荣团队参与建立了新冠肺炎防控智能追踪服务系统。

    “我们必须通过大数据把确诊人员的行动轨迹全部刻画出来,每一处遗漏都是隐患,这个过程非常复杂。”文继荣在日前召开的2020北京智源大会上表示。

    文继荣介绍,疫情追踪分为4部分。首先需要多家互联网企业合作,进行重点疫区14日内互动态势分析。其次根据确诊人员信息,结合互联网企业上报的“信息点”等,将多个互联网渠道提供的确诊人员活动轨迹进行整合和串并分析,然后绘制确诊人员的活动圈。

    接下来,要根据确诊人员的活动轨迹图,结合互联网公司等收集的确诊人员近距离接触信息,筛查出密切接触风险人员及其活动轨迹。最后综合分析这些传染风险人员的活动行为,评估传染风险人员的风险度,为疫情分析、防控和预警提供支持。

    疫情防控取得一定胜利后,复工复产成为迫切问题,然而,楼宇内的一些隔离措施成为重要阻碍。“楼宇内GPS信号弱,人员的行动轨迹无法确定,一人确诊、整体封楼这种粗放式的隔离方式不太合理,严重影响整个社会的复工复产节奏。”文继荣说。

    为了更科学、更智能、更精准的疫情防控和人员隔离,“疫情实时风险预警系统”上线。它基于蓝牙、局域网信号、气压计等信号,引进智能算法进行时空轨迹数据分析,研究人群时空轨迹,追溯近距离接触人员,做到智能防控、精准隔离,有效降低隔离成本,护航复工复产。

    对于能否将所有数据拿来统一分析,文继荣认为:“这个方法不太现实。集中进行数据分析需要非常大的算力,这需要几千甚至几万台服务器。此外,集中管理数据容易引发商业隐私等方面的问题。”

    公共利益和隐私保护“两全”

    隐私问题一直是AI发展的短板。中国工程院院士高文认为,根据我国技术和社会发展现状,想让技术和社会和谐快速发展,隐私得到很好保护,诚信非常重要。

    当新冠肺炎疫情威胁人类生存、危害人们公共利益时,隐私保护应该做出让步吗?

    “完全的隐私保护是不可能的。”文继荣说,“当今世界正在从物理世界走向数字世界,随着跟踪设备和数据收集的增加,以及数据处理能力的强化,隐私保护的问题不可避免,变得越来越重要。”

    在文继荣看来,东西方看待隐私保护的观点是不同的。北京大学副教授边凯归也表示认同:“我国民众在政府利用个人数据方面的配合度很高,而一些西方国家的配合度相对较低,这也导致国外疫情防控出现了诸多问题。当然,我们也在不断迭代技术方案,尽量保护数据隐私。”

    “我们在鼓励使用数据进行创新和促进社会发展的同时,也应该公开讨论隐私保护的风险和问题,探讨从技术、政策等方面如何做得更好。”文继荣说,“为保证数据安全可靠,可以建立数据分级分类管理机制、数据加密机制、关键数据传输协议及安全通道。”

    中国科学院院士张钹也认为中西方存在隐私保护的差异。“我国隐私保护的核心问题是不滥用个人信息。避免滥用包括两个方面,一方面是制定法律、规则,限制滥用行为;另一方面是发展安全、可靠、可信赖、可扩展的AI技术。”张钹说。

    平战结合 “数战数决”

    实际上,如何应对突发性高传染病毒疫情等重大突发公共卫生事件,一直是国际社会面临的共同难题。下一次疫情到来时,我们可以更好地利用大数据吗?

    精鼎医药亚太区真实数据负责人冯胜参与了新冠临床试验数据分析工作,他回忆道:“很多数据处于零散阶段,是疫情期间大数据利用的一个重要问题。”

    文继荣也认为这种“数据孤岛”应该被打破,“与公共卫生事件相关的很多数据散落在各个政府部门、互联网、电信运营商、物流等企业,以及民航、高铁、公交车、网约车等公共出行系统中,未能得到有效汇总和利用”。

    此外,文继荣还提出:“数据的动态性、安全性和决策的及时性,都是疫情期间制约大数据发挥作用的因素。”

    为打造重大突发公共卫生事件大数据服务平台,文继荣认为,首先要实现公共信息互通共享,打破各部门“信息孤岛”,实现计算、数据等资源完全共享,形成统一的数据标准、数据对策模块化。其次要适应数据海量增长,有效满足需求,提供充足资源。此外要实施精确的数据分析和智能决策,探索国家突发公共卫生事件的预警模型,建立突发公共卫生事件的数字信息预警体系。

    当前疫情还未获全胜,如何运用大数据服务突发公共卫生事件,是摆在国家乃至世界面前需要长远考虑的“必答卷”。

    “要通过‘平战结合’的思路,建立多种数据采集渠道,围绕关键数据的采、治、用、管、研,建立应对公共卫生事件和应急事件的完善系统和规范工作流程。”文继荣表示。

相关报告
  • 《解读:免疫学家是如何让治愈癌症成为现实》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2018-12-01
    • 2018年10月1日,北京时间17时30分许, 美国免疫学家詹姆斯·艾利森(James P Alison)和日本免疫学家本庶佑(Tasuku Honjo)因为在肿瘤免疫领域做出的贡献,荣获2018年诺贝尔生理学或医学奖。 2018年诺贝尔生理学或医学奖得主:美国免疫学家詹姆斯·艾利森(James P Alison)和日本免疫学家本庶佑(Tasuku Honjo)詹姆斯·艾利森(James P. Allison)是美国著名免疫学家,美国得克萨斯大学M·D·安德森癌症中心免疫学研究平台负责人、免疫学教授。艾利森被认为是分离出T细胞抗原(T-cell antigen)复合物蛋白的第一人,他同时发现,如果可以暂时抑制T细胞表面表达的CTLA-4这一免疫系统“分子刹车”的活性,就能提高免疫系统对肿瘤细胞的攻击性,从而缩小肿瘤的体积。他对T细胞发育和激活,以及及免疫系统“刹车”的卓越研究,为癌症治疗开创了全新的免疫治疗思路——释放免疫系统自身的能力来攻击肿瘤。艾利森1948年8月7日出生于美国得克萨斯州,在得克萨斯大学奥斯汀分校获微生物学学士学位,后又获生命科学博士学位。他是美国国家科学院院士,霍华德·休斯医学研究所研究员。2014年,他获生命科学突破奖、唐奖生物技术医药奖、霍维茨奖、盖尔德纳国际奖、哈维奖。2015年,艾利森获得有“诺奖风向标”之称的拉斯克临床医学研究奖。本庶佑(Tasuku Honjo)日本免疫学家,美国国家科学院外籍院士,日本学士院会员。现任京都大学高等研究院特别教授。1942年1月27日,本庶佑出生于日本京都府。1975年取得京都大学医学博士学位。完成学业后,本庶曾在京都大学、东京大学医学部任助手。此一时间,他也兼任了美国卡内基研究所、美国国立卫生研究院的客座研究员,在许多美国研究机关以客座身份活动。1984年开始在京大专职,担任了京都大学基因实验设施的负责人。此后数十年,他又担任过弘前大学教授、京大研究科长、医学部学部长等职。2005年开始转为京大教授。本庶教授建立了免疫球蛋白类型转换的基本概念框架,他提出了一个解释抗体基因在模式转换中变化的模型。1992年,本庶首先鉴定PD-1为活化T淋巴细胞上的诱导型基因,这一发现为PD-1阻断建立癌症免疫治疗原理做出了重大贡献,曾在2013年被《Science》评为年度十大科学突破之首。诺贝尔奖官方网站链接:https://www.nobelprize.org/2014年,基于“免疫系统刹车”抑制的第一个PD-1抑制剂在美国上市;2018年6月15日,中国食品药品监督管理总局(CFDA)正式批准PD-1抗体纳武利尤单抗注射液(商品名欧狄沃,英文名Opdivo)上市,针对的适应症是“系统治疗的非小细胞肺癌(不包括敏感基因突变患者)”,意味着我国的肿瘤治疗真正进入了“免疫”时代。科研圈找到了2014年6月发表于《环球科学》的文章,详细介绍了癌症免疫疗法取得的巨大医学进步。撰文?杰德· D ·沃夏克(Jedd D. Wolchok)翻译?戴晓橙2004年6月,一位刚从大学毕业的姑娘分到我这里做检查。她那年22岁,刚刚订婚。在毕业前的几个月里,雪莉(化名)一直被咳嗽搞得不得安宁。CT(computed tomographic,即计算机断层扫描)检查发现,她的双肺有多处阴影,而进一步的活组织检查显示,这是一种来自皮肤的恶性肿瘤——转移到肺部的黑色素瘤。雪莉从不知道自己患有黑色素瘤,她马上开始化疗,并匆忙推迟了婚期。接下来的两年里,雪莉接受了两轮化疗和脑部放疗,但不幸的是,治疗只减缓了肿瘤的恶化速度,却没能阻止肿瘤的转移。就在快要无计可施时,我告诉她,医院正在开展一种新药的临床试验,这种药物或许可以增强患者自身的免疫系统,使我们的身体有能力自己对抗癌症。这是一项随机试验,也就是说,并非每位受试者都能得到这种名叫“MDX-010”的新药,但雪莉还是答应参与试验。经过4个疗程的治疗后,雪莉拍摄了一组新的CT。结果显示,她体内所有的黑色素瘤都消失了。从那以后,雪莉一直保持着无瘤状态。现在她已为人母,有了两个漂亮又健康的孩子。用她自己的话说,她“又找回了自己的人生”。在我这样一个肿瘤专家看来,雪莉的痊愈,将人世间的一个夙愿带进了现实:科学家的确可以通过改造人体自身的免疫系统,创造出强大的抗癌疗法。过去一年中,采用与雪莉类似的疗法,或是其他治疗白血病、肾脏与肺部癌症的免疫疗法的患者,纷纷将捷报传来,医学界因此备受鼓舞。尽管免疫疗法并非万能灵药,但对于晚期肿瘤的治疗而言,这一最新成果,无疑是人们在过去几十年间取得的最大进步。免疫系统的多重防御免疫系统可以遏制肿瘤,这并非新闻。早在100多年前,纽约癌症医院(New York Cancer Hospital,纪念斯隆-凯特琳癌症中心的前身)的外科医生威廉·科利(William Coley)就曾试图用高温杀死的细菌刺激免疫系统,从而对抗恶性肿瘤。科利发现,一些在癌症手术后发生感染的患者,存活的时间似乎更长,他由此猜想,病原体在机体内激起的免疫反应,可能也会对肿瘤造成影响。在接下来的几十年里,基础研究领域的科学家对免疫系统进行了深入的研究,揭示了人体防御系统的分子组成、其中的化学介质,以及精确控制该系统的分子开关。在研究的过程中,科学家逐渐了解了免疫系统是如何动员起来,进而去发现可能引起严重感染的病原体(例如细菌和病毒)的。与之同样重要的是,研究人员亦深入理解了免疫系统的“检查”与“平衡”机制,正是因为这些机制的存在,免疫反应才不至于失控,使过多的正常组织受到损伤。总而言之,科学家已经获得了足够的细节信息,知道了免疫系统如何应对肿瘤,而肿瘤又如何影响免疫系统。机体的第一层防御机制,包括了对抗细菌与病毒的非特异性免疫反应,这一过程由血液中的白细胞(如中性粒细胞和单核细胞)负责协调。这些细胞隶属于“固有免疫系统”(innate immune system),专门识别细菌或病毒中常见的分子结构——例如部分表面结构,或是有别于高等生物的DNA和RNA分子。尽管这些白细胞并不能特异性地识别并攻击某些蛋白结构,却能抵挡许多微生物的入侵,将其分解成小分子片段——即所谓的“抗原”(antigen)。在这之后,免疫系统的其他成员便会将抗原视为异物,予以消灭。负责机体第二层防线的细胞,构成了我们的“适应性免疫系统”(adaptive immune system)。它们的工作始于对抗原的识别,继而发动更为精准的免疫攻击。如果攻击有效,机体就会产生对该种病原的“记忆”,一旦再次遇到相同的入侵病原,便能更轻易地将其击溃。T细胞和B细胞是适应性免疫应答的核心角色。T细胞有多种类型,但它们都发源于胸腺——一个位于胸部正中、心脏上方的组织。B细胞则来自骨髓,能够制造抗体。抗体分子与T细胞上一些特定的分子结构一样,都能够附着在特定的抗原上,免疫系统因此可以锁定目标,消灭细菌和表面带有抗原的受感染细胞。当机体识别并消灭有害病原时,固有免疫和适应性免疫若能通力合作,免疫系统便能达到最佳状态。此外,有一类T细胞还能长时间保留分子记忆,以便在相同的威胁再次出现时,更快地发起免疫应答。当然,癌症并不同于感染。癌细胞是发生了遗传变异等病理变化的自体细胞,但尽管如此,免疫系统还是能够识别出恶性肿瘤细胞。这是因为,后者会表达异常的分子碎片,对T细胞或者B细胞来说,这些分子碎片相当于异物。然而,在多种因素的作用下,机体对于癌症的免疫应答并没有产生显著的效果。多年以来,研究人员一直致力于刺激机体的免疫系统,强化其对癌症的免疫应答,然而,得到的结果并不稳定。最近,一些更有效、更稳定的治疗手段,将癌症的免疫治疗带到了一个新的方向。研究人员发现,有些时候,癌症可以与免疫系统的“刹车”协同作用,显著抑制机体对恶性肿瘤细胞的免疫应答,而我们所说的“新方向”,正是瞄准免疫系统的“分子刹车”,使之失去效用。阻断免疫关卡那种拯救了雪莉的试验药物,正是遵循这一思路设计出来的。这种药物的诞生,得益于对一种名叫CTLA-4的蛋白的研究。许多T细胞都能表达CTLA-4蛋白,但是,只有当特定的T细胞识别出作用目标,同时接收到来自其他分子的启动信号时,该蛋白才会被激活。一旦激活,CTLA-4就会和其他蛋白协同作用,起到分子刹车,或是“检查点”的作用,防止过度活跃的免疫系统对机体造成破坏。我们可以从那些体内没有“检查点”的动物身上,窥见这一机制的必要性。经基因工程改造、体内缺乏CTLA-4蛋白的小鼠仅能存活3~4周。如果机体没有任何阻止免疫应答的机制,过度活跃的T细胞就将入侵机体所有的正常器官,将它们完全破坏。这一发表于1995年的研究成果表明,CTLA-4蛋白的永久性缺乏,将会引发灾难性的自身免疫反应。就在同一年,加利福尼亚大学伯克利分校的詹姆斯·艾利森(James Allison)提出假设:如果可以暂时抑制CTLA-4这一“分子刹车”的活性,是否就能提高免疫系统对肿瘤细胞的攻击性,从而缩小肿瘤的体积?艾利森和同事设计了验证性实验,他们向小鼠体内注入合成的抗体,以阻断CTLA-4的活性。结果显示,抑制CTLA-4,确实可以使多种肿瘤缩小——包括移植到实验动物上的结肠癌和肉瘤。另外一些实验显示,给实验小鼠注射抗CTLA-4的抗体,以及一种实试验性疫苗(该疫苗是由经过修饰的黑色素瘤细胞制造的)后,小鼠身上的黑色素瘤显著缩小了(疫苗的目的,正是激起机体对该种肿瘤的特异性免疫反应)。研究人员的下一步任务,是将这种名为“免疫检查点阻断”的技术,从实验室转移到对人体的治疗上来。艾利森在生物技术公司Medarex找到了志同道合的伙伴,该公司已研制出人类的CTLA-4抗体——最开始名叫“MDX-010”,也就是我们现在熟知的伊匹单抗(ipilimumab),并招募那些对其他疗法完全无应答的晚期癌症患者,开展临床试验。无论是在首批试验,还是一系列后续试验中,我们都能看到一些患者的肿瘤的体积明显缩小了。而在此之前,科学家对免疫疗法进行的早期评估,往往会得到令人困惑的结果。在对这些“异常”现象进行追踪调查后,研究人员发现,一旦涉及免疫治疗,评估肿瘤疗法是否有效的常规手段,都有可能产生误导作用。疗效的评价对于标准的抗癌疗法,肿瘤学家往往很快就能判断某种疗法对患者是否有效。我们可以使用各种成像手段,如CT、PET(positron-emission tomography,即正电子发射断层扫描技术)或MRI(magnetic resonance imaging,磁共振成像),来比较刚开始治疗时和治疗6周后肿瘤的大小变化。如果恶性肿瘤明显缩小,我们就可以选择继续治疗(因为我们知道这是有效的);如若不然,我们便可以考虑采用其他疗法,或者干脆停止治疗。但对于免疫疗法,事情就不那么简单了。首先,我们需要足够的时间等待免疫系统激活,所以一般要等到治疗12周以后,我们才会去测量肿瘤大小的变化。而就算再加上6周的观察与治疗时间,CTLA-4阻断试验的结果依然不甚明朗。扫描结果显示,一些患者的肿瘤明显缩小了,而另一些患者的肿瘤却增大了——甚至还出现了新的肿瘤。然而,那些体内肿瘤增大了的患者,身体的感觉往往更好。经过免疫治疗后,患者体内的肿瘤为何会增大?现在我们有两种可能的解释:一是治疗没有效果;还有一种可能是,大量的T细胞和其他免疫细胞进入恶化组织,导致肿瘤变大了。换句话说,肿瘤的增大,恰恰代表治疗起了作用,只需再假以时日,肿瘤就会缩小。免疫疗法的疗效很难通过测量肿瘤体积来判断,因此,研究人员采用了一个既简单又重要的标准来评判伊匹单抗的疗效,将其作为最有说服力的分析结点,这一标准,就是“整体存活期”(overall survival,即患者的生存时间)。最新的临床试验结果显示,在接受伊匹单抗治疗后,20%以上的转移性黑色素瘤患者的病情在较长时间内得到了控制,治疗后的存活时间达到了3年以上。这一结果已相当令人瞩目,因为在伊匹单抗这样的现代药物出现之前,转移性黑色素瘤患者的中位预期寿命(median life expectancy)仅为7~8个月。事实上,一些较早参与试验的受试者——比如雪莉,在经过治疗后,已经生存了5年以上。与此同时,我们对免疫疗法的研究,已经推进到了第二个关键的分子刹车——PD-1上。这是一种存在于许多T细胞表面的分子。当PD-1与某些特定分子结合后,能迫使免疫细胞“自杀”(和与其密切相关的CTLA-4蛋白一样,PD-1也是一种行使正常生理功能的蛋白),从而终止正在进行的免疫反应。然而,一些肿瘤细胞进化出了一种防御机制,它们的表面带有能与PD-1蛋白结合的分子,从而诱导T细胞过早地进入自我破坏程序。如此一来,T细胞在攻击肿瘤细胞时,反而会接收到“自杀”的信号。肿瘤细胞已经练就了许多逃避免疫系统方法,而这只是其中之一。默克公司、医学免疫公司和基因泰克公司(Genentech)都各自研发了相关抗体,抑制肿瘤对PD-1的欺骗性诱导作用,从而“解救”与之对抗的T细胞。最近的临床试验结果显示,这些药物在30%以上的黑色素瘤患者中,都起到了长期性的缓解作用,在有些患者中,这种缓解作用甚至能持续好几年。并且,在这30%的患者中,还有一些是对伊匹单抗的治疗没有反应的。我在纪念斯隆-凯特琳癌症中心的几位同事,已经和其他机构的合作者一道,试验了PD-1阻断剂对一类肺癌患者的疗效:20%以上的受试者,体内的肿瘤都得到了持续性的抑制。我们在2013年11月报道了上述肺癌治疗的临床试验结果。事实证明,这成为了免疫疗法的转折点。那些曾对免疫疗法心存疑虑的医生们,再也不能将其当做一种“小众”的疗法——之前的那些试验,只能证明免疫疗法对几种特定的肿瘤有效(例如黑色素瘤和肾癌)。而今,免疫疗法在肿瘤治疗领域有了更广阔的前景。未来,免疫疗法很有可能和化疗、放疗一样,成为许多肿瘤的常规治疗手段。与绝大多数的肿瘤疗法一样,免疫疗法也会引起一些副反应。以使用抗CTLA-4药物的患者为例,很多患者会因免疫细胞释放的大量刺激性化学物质,产生皮肤和小肠的炎症反应,从而表现出红疹、肠绞痛和腹泻的症状。患者往往需要服用抑制免疫反应的类固醇药物(如强的松)来控制这些副作用。使用PD-1阻断药物的患者,也可能发生这类副反应——尤其是肾癌、肺癌和肝癌患者,但是,这些副反应的发生频率和严重性,都要比使用CTLA-4阻断剂时来得要低。幸运的是,使用抗炎药物,并不会影响这些抗肿瘤药物的疗效。炎症反应也可能引起更严重的问题。长期以来,研究人员们一直担心,免疫疗法使用的药物会使免疫反应越演越烈,以至于激发全面的自身免疫反应——在这种情况下,免疫系统会攻击很多正常组织,而机体却无法阻止。还好,与真正的自身免疫疾病不同,这些副作用似乎是暂时性的,一旦经过治疗,就不会复发。抗PD-1和CTLA-4的抗体似乎可以通过不同的途径,增强免疫系统对抗肿瘤的能力,因此,我们非常有必要研究一下,将两种药物一同使用,是否同样安全、有效。2007年的一项研究显示,在患有结肠癌和黑色素瘤的实验动物身上联用CTLA-4和PD-1阻断剂,比单独使用其中任何一种都更有效。因此,在2010年与耶鲁大学的马里奥·斯诺尔(Mario Sznol)合作进行的研究中,我们决定进行一项小范围的药物安全试验,在53位患有转移性黑色素瘤的受试者中,联合使用伊匹单抗和抗PD-1的抗体nivolumab。我们在去年的一个医学会议上报告了该项试验令人惊叹的研究结果。在接受了最优剂量的药物的治疗后,超过50%的受试者体内的肿瘤缩小了一半以上。与单独使用以上任一种抗体的患者相比,联用两种抗体收到了更明显的效果。诚然,患者身上表现出了更多的副反应,但都可以通过类固醇药物进行控制。我必须指出的是,这还只是小范围试验的初步结果,我们并不确定,当患者范围扩大、治疗时间延长,联用两种药物又会表现出什么样的疗效。目前,我们正在进行一项更大范围的联用药物试验,招募了900多位黑色素瘤患者。另外,还有一些研究人员,正在将这种“联合免疫疗法”应用到更多种肿瘤的治疗当中,其中包括肺癌、肾癌、胃癌、乳腺癌、头颈癌和胰腺癌。研究表明,其他一些直接攻击肿瘤细胞的疗法——比如化疗或放疗——在杀伤肿瘤时,可以触发机体的固有免疫系统,而这能够强化免疫疗法的作用。对于肿瘤来说,这是一场完美的“末日风暴”,因为放化疗产生的肿瘤碎片,能更有效地被免疫系统识别和攻击。这种组合式的治疗,也使T细胞形成了对肿瘤细胞的记忆。加强了警惕性的T细胞,足以在治疗停止后的很长一段时间内,防止肿瘤的复发。此类联合性免疫疗法,还可进一步与其他正在研发中的免疫治疗手段联合使用——比如肿瘤疫苗,这种联合是否会带来更好的疗效,我们拭目以待。
  • 《人工智能撬动科研范式变革!专家解读AI for Science专项部署工作》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-07-11
    • “AI for Science有可能推动我们在下一轮科技革命中走在前沿。”谈及近期科技部、自然科学基金委联合启动人工智能驱动的科学研究(AI for Science)专项部署工作,中国科学院院士、北京科学智能研究院院长、自然科学基金委“下一代人工智能”重大研究计划专家组组长鄂维南作出这样的预判。 鄂维南告诉科技日报记者,新一轮科技革命中很重要的一点,就是科学研究从“小农作坊”模式向“平台科研”模式转变,AI for Science正是推动“平台科研”的主要动力。AI技术不仅极大提高了科研活动中共性工具的效率和精度,更重要的是,它可以助力建立一个由产业需求推动科研的有效体系。 作为人工智能发展的一大趋势,国际学术界已对AI for Science形成共识——将带来科研范式的变革和新的产业业态。 “科技部、自然科学基金委联合启动AI for Science专项部署工作,进一步加强对AI for Science创新工作的统筹指导、系统布局,充分发挥我国在人工智能领域的优势,加速科学研究范式变革和能力提升,推动人工智能走向高质量应用新阶段。”中国科学院自动化研究所所长徐波说。 人工智能驱动科研突破什么瓶颈 鄂维南坦言,长期以来,科研人员在实际研究中面临四大痛点:其一,辛苦研究出来的基本原理等重要成果,用来解决实际问题时比较困难;其二,目前的实验手段,以及收集、处理、分析数据的效率相对低下;其三,科研团队工作方式多为“作坊模式”,从头到尾都自己干下来,科研效率亟待提高;其四,在解决生物制药、材料等实际问题过程中,仍然依靠经验和试错方式。 “人工智能为解决这些问题提供了有效手段,AI for Science是以‘机器学习为代表的人工智能技术’与‘科学研究’深度融合的产物。”在鄂维南看来,AI for Science为科学研究带来了新方法、新工具,在提升创新效能的同时,赋能产业应用的实际场景。 北京科学智能研究院副院长、深势科技创始人兼首席科学家张林峰认为,人工智能驱动下的科学研究最大的特点是,它以一种前所未有的方式,将不同学科、不同背景的人们连接在一起。 “Al for Science 是一个学科与知识体系大重构的过程,既需要计算机、数据科学、材料、化学、生物等学科的交叉融合,也需要数学、物理等基础学科进行更深入的理论构建和算法设计。”张林峰提醒,“当且仅当做好相关的融合,我们才有机会在新一轮科学革命中抢占先机。” 这些领域为何迫切需要AI驱动 那么,我国布局AI for Science前沿科技研发体系,将聚焦哪些领域发力? “紧密结合数学、物理、化学、天文等基础学科关键问题,布局AI for Science前沿科技研发体系,是增强基础科学研究竞争力的重要保证。”徐波解释说,新药创制、基因研究、生物育种、新材料研发等领域,则是人工智能与科学研究结合需求迫切、进展突出、具有代表性的重要方向。 比如,基于生物学机制、疾病和用药相关数据、药物的各种药学性质等建立的人工智能模型,可预测新药的安全性和有效性;通过人工智能辅助,可减少研发中的人力、物力和时间投入,提高药物研发成功率。当人工智能赋能新材料研发后,可实现将电子尺度和分子尺度等多尺度材料计算模拟方法耦合,快速筛选符合目标性能的新材料成分和构型,压缩新材料与器件研发周期和成本…… “科学研究中的人工智能方法,不能简单照搬我们熟知的AI领域,如计算机视觉和自然语言处理等领域现有模型和算法,而需要根据每个基础科学具体情况,研发针对性的智能算法、模型和软件工具。”徐波强调,只有将人工智能技术与自然科学和技术科学的领域知识深度结合,才能充分发掘人工智能加速重大科学问题研究和知识发现的变革性潜力。 整合资源形成推进合力 谈及我国在该领域的发展,鄂维南直言,我们率先意识到人工智能方法对基础科学研究可能产生的影响,全面布局AI for Science的科学研究和培养科研团队,将人工智能方法、高性能计算与物理模型相结合,并已走在了国际前沿。但如何高效利用这些优势积极引导布局,使我国在当下的科技革命中走在前列,并率先打造出新的科研体系、有效调动人才资源、合理利用资金和算力资源,是亟需解决的问题。 值得注意的是,科技创新2030—“新一代人工智能”重大项目已将AI for Science作为人工智能的重要发展方向进行安排。徐波介绍,在2022年指南中,部署了“重大科学问题研究的AI范式”任务,面向地球科学、空间科学、化学和材料科学、生物医药科学等领域重大科学问题开展创新研究。同时,面向国际竞争激烈的蛋白质结构预测领域,支持国内优势团队开展科研攻关。 记者了解到,科技部将以科技创新2030—“新一代人工智能”重大项目为牵引,加快人才、技术、数据、算力等要素汇聚,形成推进AI for Science的政策合力。在平台支撑方面,科技部正在加快推动公共算力开放创新平台建设,将为AI for Science发展打造智能算力基座;在机制创新方面,科技部将鼓励用户单位围绕业务深度挖掘技术需求和科学问题,深度参与模型研究与算法创新,积极开放数据、资源。 着眼未来发展,鄂维南提醒,要把资源真正配置到一线科研人员手中。AI for Science时代,更需构建垂直整合的人才团队,以重点问题为牵引,真正让人工智能的研究人员与基础科学领域如材料、能源等的研究人员一起工作,进行高频的学术交流和思想碰撞。 “AI for Science的潜力正在不断释放,但也面临‘点’上研究较多、追逐‘热点领域’研究较多,而系统布局较少的现实问题。”徐波说,为此,科技创新2030—“新一代人工智能”重大项目将在第二个五年实施阶段(2023—2027年)持续加强体系化布局和支持力度,拟研究人工智能驱动科学研究的新理论、新模型、新算法,研发跨尺度建模、高精度仿真、微分方程智能解算等共性研发工具和平台,发展一批针对典型科研领域的AI for Science专用平台,推进软硬件计算技术升级,打造智能化科研的开源开放创新生态。