《AI for Science 势不可挡:科技部启动「人工智能驱动的科学研究」专项部署工作》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-05-17
  • 为贯彻落实国家《新一代人工智能发展规划》,科技部会同自然科学基金委近期启动“人工智能驱动的科学研究”(AI for Science)专项部署工作,紧密结合数学、物理、化学、天文等基础学科关键问题,围绕药物研发、基因研究、生物育种、新材料研发等重点领域科研需求展开,布局“人工智能驱动的科学研究”前沿科技研发体系。

    科技部有关负责人表示,当前,“人工智能驱动的科学研究”已成为全球人工智能新前沿。我国在人工智能技术、科研数据和算力资源等方面有良好基础,需要进一步加强系统布局和统筹指导,以促进人工智能与科学研究深度融合、推动资源开放汇聚、提升相关创新能力。

    “人工智能驱动的科学研究”是以“机器学习为代表的人工智能技术”与“科学研究”深度融合的产物。中国科学院院士、北京大学国际机器学习研究中心主任鄂维南表示,借助机器学习在高维问题的表示能力,人类可以更加真实细致地刻画复杂系统的机理,同时可以把基本原理以更加高效、更加实用的方式应用于解决实际问题中。

    科技创新2030-“新一代人工智能”重大项目实施专家组组长、中国科学院自动化研究所所长徐波介绍,人工智能技术已经在很多科学研究领域展现出超越传统数学或物理学方法的强大能力,但在“人工智能驱动的科学研究”体系化布局、重大系统设计、跨学科交叉融合、创新生态构建等方面仍有提升空间。

    科技部将推进面向重大科学问题的人工智能模型和算法创新,发展一批针对典型科研领域的“人工智能驱动的科学研究”专用平台,加快推动国家新一代人工智能公共算力开放创新平台建设,支持高性能计算中心与智算中心异构融合发展,鼓励绿色能源和低碳化,推进软硬件计算技术升级,鼓励各类科研主体按照分类分级原则开放科学数据。

    在人才与机制方面,科技部支持更多数学、物理等科学领域科学家、研究人员投身于相关研究,培养与汇聚跨学科研发队伍,推动成立“人工智能驱动的科学研究”创新联合体,搭建国际学术交流平台,共同推动解决癌症诊疗、应对气候危机等人类共同科学挑战。同时,重视“人工智能驱动的科学研究”发展过程中的科研伦理规范,促进其健康可持续发展。

    下一步,科技部将充分发挥新一代人工智能规划推进办公室的协调作用,整合项目、平台、人才等资源,形成推进的政策合力。充分发挥人工智能渗透性、扩散性和颠覆性强的特性,逐步构建以人工智能支撑基础和前沿科学研究的新模式,加速我国科学研究范式变革和能力提升。

  • 原文来源:http://www.gov.cn/xinwen/2023-03/27/content_5748495.htm
相关报告
  • 《人工智能撬动科研范式变革!专家解读AI for Science专项部署工作》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-07-11
    • “AI for Science有可能推动我们在下一轮科技革命中走在前沿。”谈及近期科技部、自然科学基金委联合启动人工智能驱动的科学研究(AI for Science)专项部署工作,中国科学院院士、北京科学智能研究院院长、自然科学基金委“下一代人工智能”重大研究计划专家组组长鄂维南作出这样的预判。 鄂维南告诉科技日报记者,新一轮科技革命中很重要的一点,就是科学研究从“小农作坊”模式向“平台科研”模式转变,AI for Science正是推动“平台科研”的主要动力。AI技术不仅极大提高了科研活动中共性工具的效率和精度,更重要的是,它可以助力建立一个由产业需求推动科研的有效体系。 作为人工智能发展的一大趋势,国际学术界已对AI for Science形成共识——将带来科研范式的变革和新的产业业态。 “科技部、自然科学基金委联合启动AI for Science专项部署工作,进一步加强对AI for Science创新工作的统筹指导、系统布局,充分发挥我国在人工智能领域的优势,加速科学研究范式变革和能力提升,推动人工智能走向高质量应用新阶段。”中国科学院自动化研究所所长徐波说。 人工智能驱动科研突破什么瓶颈 鄂维南坦言,长期以来,科研人员在实际研究中面临四大痛点:其一,辛苦研究出来的基本原理等重要成果,用来解决实际问题时比较困难;其二,目前的实验手段,以及收集、处理、分析数据的效率相对低下;其三,科研团队工作方式多为“作坊模式”,从头到尾都自己干下来,科研效率亟待提高;其四,在解决生物制药、材料等实际问题过程中,仍然依靠经验和试错方式。 “人工智能为解决这些问题提供了有效手段,AI for Science是以‘机器学习为代表的人工智能技术’与‘科学研究’深度融合的产物。”在鄂维南看来,AI for Science为科学研究带来了新方法、新工具,在提升创新效能的同时,赋能产业应用的实际场景。 北京科学智能研究院副院长、深势科技创始人兼首席科学家张林峰认为,人工智能驱动下的科学研究最大的特点是,它以一种前所未有的方式,将不同学科、不同背景的人们连接在一起。 “Al for Science 是一个学科与知识体系大重构的过程,既需要计算机、数据科学、材料、化学、生物等学科的交叉融合,也需要数学、物理等基础学科进行更深入的理论构建和算法设计。”张林峰提醒,“当且仅当做好相关的融合,我们才有机会在新一轮科学革命中抢占先机。” 这些领域为何迫切需要AI驱动 那么,我国布局AI for Science前沿科技研发体系,将聚焦哪些领域发力? “紧密结合数学、物理、化学、天文等基础学科关键问题,布局AI for Science前沿科技研发体系,是增强基础科学研究竞争力的重要保证。”徐波解释说,新药创制、基因研究、生物育种、新材料研发等领域,则是人工智能与科学研究结合需求迫切、进展突出、具有代表性的重要方向。 比如,基于生物学机制、疾病和用药相关数据、药物的各种药学性质等建立的人工智能模型,可预测新药的安全性和有效性;通过人工智能辅助,可减少研发中的人力、物力和时间投入,提高药物研发成功率。当人工智能赋能新材料研发后,可实现将电子尺度和分子尺度等多尺度材料计算模拟方法耦合,快速筛选符合目标性能的新材料成分和构型,压缩新材料与器件研发周期和成本…… “科学研究中的人工智能方法,不能简单照搬我们熟知的AI领域,如计算机视觉和自然语言处理等领域现有模型和算法,而需要根据每个基础科学具体情况,研发针对性的智能算法、模型和软件工具。”徐波强调,只有将人工智能技术与自然科学和技术科学的领域知识深度结合,才能充分发掘人工智能加速重大科学问题研究和知识发现的变革性潜力。 整合资源形成推进合力 谈及我国在该领域的发展,鄂维南直言,我们率先意识到人工智能方法对基础科学研究可能产生的影响,全面布局AI for Science的科学研究和培养科研团队,将人工智能方法、高性能计算与物理模型相结合,并已走在了国际前沿。但如何高效利用这些优势积极引导布局,使我国在当下的科技革命中走在前列,并率先打造出新的科研体系、有效调动人才资源、合理利用资金和算力资源,是亟需解决的问题。 值得注意的是,科技创新2030—“新一代人工智能”重大项目已将AI for Science作为人工智能的重要发展方向进行安排。徐波介绍,在2022年指南中,部署了“重大科学问题研究的AI范式”任务,面向地球科学、空间科学、化学和材料科学、生物医药科学等领域重大科学问题开展创新研究。同时,面向国际竞争激烈的蛋白质结构预测领域,支持国内优势团队开展科研攻关。 记者了解到,科技部将以科技创新2030—“新一代人工智能”重大项目为牵引,加快人才、技术、数据、算力等要素汇聚,形成推进AI for Science的政策合力。在平台支撑方面,科技部正在加快推动公共算力开放创新平台建设,将为AI for Science发展打造智能算力基座;在机制创新方面,科技部将鼓励用户单位围绕业务深度挖掘技术需求和科学问题,深度参与模型研究与算法创新,积极开放数据、资源。 着眼未来发展,鄂维南提醒,要把资源真正配置到一线科研人员手中。AI for Science时代,更需构建垂直整合的人才团队,以重点问题为牵引,真正让人工智能的研究人员与基础科学领域如材料、能源等的研究人员一起工作,进行高频的学术交流和思想碰撞。 “AI for Science的潜力正在不断释放,但也面临‘点’上研究较多、追逐‘热点领域’研究较多,而系统布局较少的现实问题。”徐波说,为此,科技创新2030—“新一代人工智能”重大项目将在第二个五年实施阶段(2023—2027年)持续加强体系化布局和支持力度,拟研究人工智能驱动科学研究的新理论、新模型、新算法,研发跨尺度建模、高精度仿真、微分方程智能解算等共性研发工具和平台,发展一批针对典型科研领域的AI for Science专用平台,推进软硬件计算技术升级,打造智能化科研的开源开放创新生态。
  • 《北京智源人工智能研究院启动“智源学者计划” 》

    • 来源专题:北京市经济和信息化委员会监测服务平台
    • 编译者:zhangmin
    • 发布时间:2019-04-18
    • 4月16日,北京智源人工智能研究院与旷视召开“智源学者计划暨联合实验室发布会”。北京市科委副主任张光连,海淀区委常委、副区长李俊杰,以及来自科技部、北京市科委、海淀区人民政府、朝阳区人民政府、中关村管委会,北京脑科学与类脑研究中心、北京量子信息科学研究院、北京生命科学研究所等科研机构,北京亦庄国际投资发展有限公司等投资机构,以及智源研究院相关发起单位等领导及代表出席会议。 北京智源人工智能研究院是在科技部和北京市委市政府的指导和支持下,由北京市科委和海淀区人民政府推动成立,依托北京大学、清华大学、中国科学院、旷视等北京人工智能领域优势单位共建的新型研发机构。 北京智源人工智能研究院副院长刘江介绍,自2018年11月成立以来,北京智源人工智能研究院按照《北京市支持建设世界一流新型研发机构实施办法(试行)》精神,积极探索新型科研管理等机制体制创新,贯彻国家新一代人工智能发展规划总体部署,实施“智源学者计划”,支持科学家勇闯人工智能科技前沿“无人区”,同时与北京优势高校院所和骨干企业共建联合实验室,开展跨学科、大协同的创新攻关,引领未来人工智能基础研究方向。 北京市科委副主任张光连在讲话中指出,北京市科委在2018和2019年两年给予智源研究院共计3.4亿元的资金支持,海淀区在办公空间、人才政策等方面提供了服务保障,今后还将支持智源研究院积极争取国家科技部等部门支持,承接国家科技创新2030—“新一代人工智能”重大项目等任务。今年,北京将开放一批人工智能应用场景,推动人工智能新技术、新产品、新模式在北京率先运用,促进人工智能和实体经济深度融合。同时,还将成立智源人工智能产业培育基金,超前布局,分担企业创新风险,积极培育一批国际领先的人工智能企业。 微信图片_20190417104553.jpg 智源学者计划发布 着力培养国际影响力的青年学术英才 据北京智源人工智能研究院院长黄铁军介绍,此次发布的“智源学者计划”,是智源研究院打造高层次基础研究人才队伍的引领性工程,旨在面向当前和未来人工智能创新发展,选拔并培养一批德才兼备、具有国际影响力的学科领军人才和具有发展潜力的青年学术英才,构建富有创新能力、梯队合理的人工智能基础研究创新团队,建立面向未来人工智能发展的高端人才储备,引领未来人工智能基础研究方向,推动北京人工智能产业创新发展。 “智源学者计划”为从事人工智能基础研究的科学家营造了良好的科研环境,给予科学家充分的尊重和信任,将技术路线决策权和人财物支配权全部交于科学家,试点科技经费“包干制”,使科学家可以心无旁骛、潜心研究、创新突破。“‘智源学者计划’的目标,就是要找到最好的人,给他自由支配的经费,提供他需要的资源,支持开展人工智能领域特定方向上的重大基础问题研究,或者开展前沿问题的自由探索。”黄铁军说。 具体来说,“智源学者计划”将依托北京大学、清华大学、中国科学院等优势高校院所,以及旷视等骨干企业研究院,对四类人才进行重点支持,分别是:智源科学家首席(CS)、智源研究项目经理(PM)、智源研究员(PI)和智源青年科学家。其中,智源首席科学家(CS)由领域内顶尖专家学者担任,负责研究方向的整体规划布局,并推荐智源研究员(PI)人选;智源研究项目经理(PM)则兼备技术和管理才能,协助CS管理项目,并负责多方沟通;智源研究员(PI)是所属研究领域的领军人才,开展确定领域的科研活动;智源青年科学家是38岁以下拥有博士学位、在科研上具有无限发展潜力的青年学者,并在智源研究院对支持下开展开放性、探索性研究,勇闯人工智能科技前沿“无人区”,面向未来人工智能新思维和新体系的发展提出引领性的原创基础研究成果。 目前,经过提名、初评、审议等流程,已经遴选出首批智源学者共21人,并即将启动公示程序。其中,首批智源学者“人工智能数理基础”重大研究方向首席科学家(CS)由中国科学院院士、北京大学数学科学学院张平文教授担任,智源研究项目经理(PM)由北京大学夏壁灿教授担任,智源研究员(PI)候选人由来自北京大学、清华大学、中国科学院的10名杰出中青年学者。首批“智源青年科学家”候选人共9人,其中“人工智能数理基础”5人,“机器学习”方向4名,分布来自北大、清华、北京应用物理与计算数学研究所和旷视。其中,入选首批“智源青年科学家”候选人的旷视研究院研发总监张祥雨博士仅28岁,也是首批智源学者候选人中年龄最小的一位。 按照计划,首批智源学者将致力于打破基于计算机实验和神经科学的人工智能的惯用建模范式,以可解释性的新型人工智能模型、新型的机器学习算法、深度学习的基础研究为研究内容,解决人工智能面临的可计算性、可解释性、泛化性、稳定性等基础理论问题,建立以数学与统计理论为第一原理的新一代人工智能方法论。 黄铁军表示,今年将计划遴选智源学者100人,其中青年科学家30-50人。2020年和2021年再分别增加100人,智源学者总体规模保持在300人左右 智源与旷视共建联合实验室 建设一体化开放创新平台 会上海淀区委常委、副区长李俊杰、旷视首席科学家孙剑教授共同为“北京智源 - 旷视智能模型设计与图像感知联合实验室”揭牌。该联合实验室拟由旷视首席科学家兼旷视研究院院长孙剑任实验室主任,研究员周舒畅任实验室副主任。 “目前有大量的高校、研究院所、创新创业人员和行业客户,想参与到人工智能创新中,但苦于没有数据,算力或算法等资源,无法施展。”在发布会现场,孙剑一针见血指出了当前人工智能行业创新所面临的问题。 2017年7月,国务院发布《新一代人工智能发展规划》,人工智能上升为国家战略。建立开源开放的人工智能开放创新平台,服务企业应用技术开发成为当前该领域的难点。国家也希望龙头企业通过打造人工智能开源开放创新平台,调动产学研,社会各类创新创业主体参与共同打造我国自主知识产权的产业生态,提升国际影响力,促进行业整体发展。 同时,北京市作为第一个国家新一代人工智能创新发展试验区,也希望能够充分调动北京技术、人才方面优势,通过组织机制创新,依托龙头企业牵引进行多主体协同创新,打造我国乃至全球技术高地。 “北京智源 - 旷视智能模型设计与图像感知联合实验室”也因此孕育而生。孙剑表示,旷视与智源通过联手打造数据集和建设联合实验室,来推动整个行业协同创新发展,建设共性技术开放创新平台,构建自主可控产业生态。 据孙剑介绍,“北京智源 - 旷视智能模型设计与图像感知联合实验室”将基于旷视在计算机视觉技术和应用的深厚积累,通过3年时间,建设一体化的数据共享、模型设计与场景测试的开放创新平台,突破大数据背景下模型架构设计、优化和部署等技术,探索突破视觉系统性能极限和模型设计及场景测试的自动化,推进大数据背景下模型架构设计、优化和部署等方面的研究。 数据方面,实验室将立足旷视算法落地场景丰富、数据积累深厚的优势,以开源数据集、预抽取特征等形式,持续开放通用物体分类、物体检测追踪、人像人形识别属性等视觉问题数据,助力相关领域研究。针对高搜索效率、高准确率、高灵活性等关键指标,该实验室还将开展支持大计算量模型的新神经网络架构搜索算法(NAS)研究,构建一站式深度模型自动化设计平台等工作。 模型设计优化方面,平台将提供自动化模型搜索、错误分析与可视化工具,加速大模型架构探索和优化,降低面向应用的模型设计门槛,来解决传统模型架构人工设计方法的经验性强,迭代周期长的问题。同时,实验室还将积极探索低位宽神经网络相关技术,研究实现对于大计算量模型的云上和终端两级的硬件支持,完成从模型搜索到实际应用的垂直整合。 场景验证方面,实验室将通过建设人脸抓拍识别、结构化检测、大规模人像比对等验证场景和提供自动分析报告服务,为研究算法调优提供环境,并积极探索低位宽等网络压缩技术,研发高效硬件部署方案,推动模型研究成果迅速投入实用。针对计算机视觉算法与真实场景适配的问题,实验室还将建设可重现的实景测试环境,并提供自动化的量化错误分析报告,帮助算法迭代。 孙剑表示,实验室平台建成后,将面向高校院所、创业企业等创新创业主体开放,致力推动图像感知与计算领域的协同创新。“通过以上措施,实验室将被打造成为一个开放、贴近实际场景的计算机视觉算法研究实验平台,形成涵盖数据、平台、场景的完整闭环,有利于打造我国自主可控的技术和产业生态,共同助力我国图像感知和计算领域的技术及应用达到国际先进水平。” 北京智源人工智能研究副院长唐杰表示,北京智源联合实验室是智源研究院面向人工智能未来发展,围绕重大应用需求,联合各大高校、科研院所、优势企业等机构进行全方位科研合作的平台。其目标是高效整合大学、科研院所、企业的数据、平台、场景等优势资源,形成具有国际领先水平的人工智能研究团队,培育国际顶尖AI人才,推动人工智能产学研协同创新发展,产出系列国际领先水平的突破性成果,并将重点组织数据共享,支持算法开源,推动场景开放,实施协同创新。智源联合实验室分为两类,分别是与高校院所共建、与优势企业共建。共建单位将提供配套资金、场地、设备等条件保障,解决实验室建设与运行中的有关问题。 在联合实验室的建设上,智源研究院遵循“成熟一个、启动一个”的原则,择优支持共建,最多可连续支持三年。唐杰强调,“北京智源 - 旷视智能模型设计与图像感知联合实验室” 已通过立项论证,也是智源联合实验室首个成功落地的项目。 全球最大的物体检测数据集发布 首批开放超过60万张图像和1000万标注框 会上,旷视研究院联合北京智源人工智能研究院发布全球最大的物体检测数据集——Objects365。旷视研究院院长孙剑说,该数据集也是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。 规模方面,Objects365定义了生活中常见的365个类别,第一批将开放63万张图像,1000万的标注框。开放图片数是COCO的5倍,标注框超过COCO的11倍。 算法优化的上限严重依赖于基准数据集术的质量。为保证标注质量,在打造Objects365时,旷视设计出一套科学而严格的标注流程,每一张图片的背后至少会经过9名标注工人之手。 此外,作为一个优秀的预训练数据集,Objects365预训练模型在使用过程中,可以轻松超越现有算法的精度,显著加速收敛过程,表现出极强的泛化能力。在执行COCO、VOO Det、CityPersons等检测任务时,在VOC Seg和ADE等分割任务上均有显著提升。 DIW2019挑战赛即将启动 共同探讨检测问题的瓶颈及优化方向 Detection In the Wild 2019(DIW 2019)挑战赛也发布会当天正式启动。据孙剑介绍,该挑战赛是基于2019年CVPR的研讨会,由旷视联合北京智源人工智能研究院举办,其目的是为了推动目标检测技术的发展,改善现有目标检测数据集的类别覆盖不全、标注精度不高、密集场景缺少等问题。挑战赛于5月10日开放测试集,6月10日结果提交截止,6月10日公布比赛结果,并邀请优胜队介绍比赛经验。主办方为每个赛道的冠军队伍准备了10000美元的奖励届时,优胜队将在CVPR现场的研讨会上介绍经验,共同探讨检测问题的瓶颈及优化方向。 DIW2019挑战赛的比赛赛道分为三个赛道,即Objects365赛道、Objects365小赛道和CrowdHuman赛道。 其中,为探索目标检测系统的瓶颈,参加Objects365赛道的选手将利用公开的365种类别,60万张图片超过1000万个框的完整训练集对检测模型进行训练;在3万张图片构成的验证集上调试算法,并在10万张图片构成的测试集上进行最终的挑战。 为了降低参赛门槛,加快算法迭代速度,研究长尾类别检测问题,Objects365小赛道则从Objects365数据集中挑选出65个类别,选手可以用1万张图片进行模型的训练。 CrowdHuman赛道则是为了解决现实生活中的遮挡问题,其算法的提升将会推动人体检测算法落地。届时,选手将基于专门为了密集场景人体检测设计的CrowdHuman数据集进行训练,数据集包含有丰富标注信息和多种场景。