《开放标本运动建议或将改变现代科学》

  • 来源专题:生物科技领域知识集成服务
  • 编译者: 陈方
  • 发布时间:2021-03-08
  • 动物源性冠状病毒引起了例如SARS、MERS以及当前的新冠肺炎等新发传染病(Emerging Infectious Disease,EID)的暴发,在寻找引起新冠肺炎疫情的病毒SARS-CoV-2宿主的过程中,天然宿主的研究对象曾指向蝙蝠和穿山甲,但病毒的中间宿主目前尚不明晰。迄今为止,对于动物、动物产品等相关的病原体筛查并没有相关国际惯例,并且在多数时候研究人员对EID诊断的能力也相对有限。基于此,国际实地项目(Field Projects International,FPI)野生动物疾病监测重点研究小组研究人员M. Watsa等2020年7月10日在《科学》发文表示,与野生动物贸易相关的EID风险仍是当前疾病监测工作中尚未解决的最大挑战,同时提出了防范人畜共患EID需进行“严格的野生动物疾病监测”的观点 。2020年11月13日,美国堪萨斯大学生物多样性研究所研究员、堪萨斯大学自然历史博物馆哺乳动物助理馆长Jocelyn Colella在《科学》发文 ,对M. Watsa等提出的“严格的野生动物疾病监测”观点表示部分赞同,M. Wasta等强调了“全健康(One Health)”的方法在促进整合目前孤立的人畜共患疾病研究等方面的重要价值,然而,大多数导致人类严重疾病暴发的病原体都是动物源性的,在了解其野生宿主进化以及相关公共卫生领域,国际社会对自然历史博物馆冷冻脊椎动物组织收藏发展的支持仍是“全健康”中缺失的一个关键组成部分;同时Jocelyn Colella指出,博物馆生物库可作为公共卫生研究的重要参与者,以帮助满足分析、监测和减轻EID的迫切需要。在自然历史博物馆发展方面,考虑到生物标本作为主要科学数据的重要性,12月16日,Jocelyn Colella在《生物科学》发文,进一步针对标本保藏等问题,提出了开放标本运动(Open-Specimen Movement)建议 ,旨在将开放科学精神(即通过强调增加透明度、可重复性以及数据共享来改变现代科学)应用于自然历史博物馆标本的存放、管理等方面。
    为了对公共博物馆中的标本和相关数据进行更好的保存,Jocelyn Colella提出的开放标本运动建议鼓励科学期刊和出版商扩大开放数据倡议,同时通过资助机构和许可机构将标本保藏实践纳入数据管理计划(Data management plans,DMPs)等来提高标本存放的要求。
    1. 期刊和出版商对开放标本的要求
    越来越多的期刊和出版商采用开放数据政策,要求作者保存并上传相关数据以增加文章数据的透明度、开放性以及重现性。但其对数据方面的要求(尤其对特定数据类型的要求)来说,各期刊间差异较大。总的来看目前最少关注的是标本问题(动物学和生态学的期刊体现较为明显),比如大多数提到标本的只要求对新物种进行描述即可,并未对其保藏做相关规定,这也容易导致部分相关数据来源(比如测量值等)与期刊要求的保留原始数据之间的矛盾,而这一问题是对整个生物界敲出的警钟,警示研究人员需重点关注原始标本数据的保存。另一方面,除动物学和生态学类期刊外,更多的期刊应加入到对物理材料永久保藏进行要求的队伍中来,在跨期刊开放数据要求不一致的问题上,需鼓励编辑和审稿人对作者提出标本保藏的要求,这对于促进规范标本保藏的生命科学文化变革至关重要。
    2. 资助和许可机构对标本存放的要求
    在过去十年中,许多美国联邦机构已经有意识地转向开放数据框架,并通过法律要求和建议以及相关行动来提高数据透明度和安全性。尽管如此,现有的开放数据的要求高度可变且特定于某些机构,并且很少将标本作为主要数据来使用。但事实上,在促进科学发展、确保国家数据利益并为科学基础设施做出贡献方面,标本的存放与这些机构的使命密切相关。目前,基于馆藏的研究机构在其馆藏管理指南和许可申请中,都提到了通过对标本的永久保藏确保发布数据以标准化和开放形式进行呈现。但需要注意的一点是,鉴于标本对于科学的可重复性和扩展性的重要作用,就以前标本收藏许可申请中提到的“不再具有美国地质调查局(US Geological Survey,USGS)认定的科学价值或潜在用途,则可以对其进行销毁”的说法应进行相关更改,对某些保藏品确定为没有价值就对其销毁的做法也是不合理的。总之,将标本管理明确纳入提议的DMPs、许可证申请和强制性年度报告将有助于缩小现有差距,并创建更加统一的标本存放文化。
    3. 将标本整合到DMPs中
    DMPs描述了在项目过程中要收集、存储和共享的数据类型,以确保长期的数据使用、重用和延用。鉴于标本保藏的价值,除了通常被认为是DMPs一部分衍生数据资源的计划之外,制定明确的标本存放、可访问性计划等是至关重要的。标本管理的最佳实践适用于标本或数据生命周期的所有阶段,包括规划(Planning)、获取(Acquisition)、使用(Use)、保存(Preservation)和传播(Publication and sharing),这一过程凸显了标本馆藏在数据安全中的关键作用。在设计全面的、具有标本意识的DMPs时有几个考虑因素是确保广泛保存和获取材料所必需的,而博物馆馆藏在促进这一过程中具有核心作用。
    (1)规划
    DMPs提供了有关要收集物种及样品的基本信息,以及最终授权获取生物或样品的相关许可信息。DMPs应清楚的确定许可机构,并指定要收集并最终保藏的标本数量及分类学身份。另一方面,为了缓解研究人员对正在进行的项目中竞争的恐惧,相关标本可以由项目研究人员暂存,但DMPs需明确双方商定的保藏范围和时长,因此DMPs还应包括研究人员计划。事实上,与项目研究人员相比,博物馆拥有更好的长期对数据安全性使用和管理等方面的能力,标本所有权转移到博物馆中可以确保这些资源及其相关数据有更高的价值或使用寿命,从而最大限度的提高了这些资源未来的可重用性。
    (2)获取
    野外采集、标本制备等的最佳实践在各分类群中已经确立,这对于确保高质量保藏和最大限度提高可重用性至关重要。DMPs应包括对一系列数据格式和内容(例如记录标本的体重、性别、采集环境、采集日期、采集方法、采集人等)的相关标准准备计划,以便通过研究工作流程,简化对生物样本或相关样本的跟踪并扩展其使用范围。
    (3)使用
    DMPs应包括对派生数据的描述,且最好以有助于在尚未预料到的或长期的项目中重复使用的方式处理原始标本数据,同时还应确保在整个样本和研究工作流程中保持适当的记录以提高可重用性和样本实用性,并将其集成到博物馆的样本跟踪数据库中。
    (4)保存
    数据管理的最佳实践包括将多个数据副本存放在不同地方以降低与单副本数据相关的风险。与长期标本的整理、存储和维护相关的成本可能很高,因此通常是DMPs和提案预算的重要组成部分。收集人员和已识别的生物存储库必须事先就拟议的标本保存费用达成共识,以避免不必要的财务压力和标本临时纳入博物馆而带来后续的挑战。对于多年期项目,DMPs还应指定保存间隔,促进在标本采集和使用后快速、定期地将标本整合到公共研究馆藏中,以确保尽可能高的数据准确性和安全性。
    (5)传播
    DMPs应以开放的、机器可读的格式维护详细的标本信息,该格式既可以数字方式访问,又可以与最终出版物相关联,以最大程度地提高相关数据的可访问性和数据集成性。数字化的相关举措(如iDigBio)正在增加标本数据的数字连接性,而这将进一步促进综合科学观点,防止不必要的重复,最大化收集材料的科学潜力,并增加对全球研究人员有用的不断增长的生物信息系统。
    4. 结论
    时间久远和地理范围广泛的生物样本收集的累积价值不仅在于通过单一调查获得的即时见解,还在于随着技术的发展、访问范围的扩大以及数据流的增强而使标本相关数据大量预期外的未来用途变得关联性越来越高。作为标本保存和管理的关键基础设施,自然历史博物馆的记录使标本的普遍保存、可用性、安全性和未来的广泛使用成为可能,体现了开放科学伦理(open-science ethic)。在博物馆内建立标本基础设施是扩展标本网络的基础,从而可以公开地管理、使用和共享原始的生物多样性记录。在最近一些美国联邦机构资助的野生动物采样计划中严重忽视了标本保藏的重要性,如美国国家科学基金会(National Science Foundation,NSF)资助的国家生态监测网(the National Ecological Observatory Network,NEON)等,在一定程度上给更广泛的科学界带来了损失。诸如此类的大规模野生动植物采样计划缺乏标本档案,阻碍了科学重现、推广以及研究人员对宿主标识、分布、性状和病原体关联的生物分类验证。将标本纳入现有的DMPs和年度报告要求并增加期刊的开放数据要求,将确保科学的可重复性,并有利于防止国家和全球生物多样性不可替代的记录丢失。而这可以通过编辑审核主要科学文献、批准和许可申请的推荐人以及年度报告来实现,随着时间的推移,这些措施可以转变目前现状并使其趋于正常化。在全球快速变化和生物多样性丧失的时期,这种新的转变将确保野外采集标本的持续利用,并促进基于标本的科学透明度和可重复性。
    宋琪 编译自https://academic.oup.com/bioscience/advance-
    article/doi/10.1093/biosci/biaa146/6030117?login=true
    原文标题:The Open-Specimen Movement

相关报告
  • 《开放科学是更好的科学》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-10-23
    • 开放科学运动的核心是坚信开放科学是更好的科学——更严谨、更具包容性、更高效、更值得信赖、更可复制,对社会更有影响力。 开放科学实践的各个方面(从开放方法和数据,到预印本,到ORCID和CRediT,再到开放同行评议)都是相辅相成的循环的一部分。每一个组成部分都相互配合,随着开放科学普及率的提高,效益也会增加,并不断向外扩展,重塑研究体系,最终产生更好的科学。 PLOS的使命是引领这种变革。要实现这一目标,最好的办法就是让研究人员能够大规模地参与基本的开放科学实践,具体做法如下:(1)提供符合研究人员以及公众目标和优先事项的开放科学选项;(2)消除障碍,提升所有研究人员使用开放科学的机会。 PLOS于2003年推出PLOS Biology,帮助证明了开放获取期刊的可行性,并于2009年推出PLOS ONE,让更多研究人员能够实现开放获取。2014年,PLOS首创数据可用性政策重新设定了整个行业的数据共享标准。简化预印本合作方式减轻研究人员的行政负担,使早期共享正常化,并增加了对新科学的获取能力。 为了更好地了解研究人员的需求,激励开放实践以提高研究质量和可靠性,并增加对开放出版选项的访问。PLOS对现阶段的工作进行总结如下: 开放科学指标(OSIs) 为了提高开放科学实践的普及率,我们需要能够可靠地衡量开放科学实践。开放科学指标(OSIs)使用自然语言处理技术识别和量化已发表文献中的开放科学行为,并比较不同学科、地区和其他因素的生成率和使用率从而能够更好地了解和满足研究人员的需求;通过公开数据集,希望也能支持PLOS以外的研究工作。目前,OSI数据集包括数据共享、代码共享和预印本,未来将纳入更多指标。 可获取的数据 读者依靠原始科学数据来理解、验证、复制和再分析,并为未来的调研、系统综述和荟萃分析提供信息。但研究人员只有知道数据的存在,才能获取和使用数据。PLOS的“可访问数据”功能是一项试验性功能,它提高了PLOS论文页面上关联数据的可见度。通过这种方式突出显示可公开获取的数据,促进数据的获取和再利用,节省读者在线搜索公共数据的时间。在第一年取得成功后,"可访问数据"功能最近从最初的三台服务器扩展到九台。 超越文章处理费 文章处理费(Article Processing Charges, APC)证明了开放获取的可行性。但是,APCs也具有排斥性和不公平性;对作者来说负担沉重,对出版商来说管理起来费时费力;而且往往会产生以量取胜的激励机制。PLOS正在超越 APCs,采用新的资助模式,更公平地分配出版成本,减少每个人的支出,包括社区行动出版和机构协议。
  • 《美国宇航局向开放科学转型》

    • 来源专题:科技期刊发展智库
    • 编译者:唐果媛
    • 发布时间:2022-09-29
    •        美国宇航局认为开放科学有四大好处: ① 可达性:公民科学倡议和参与;通过获取医疗和科学信息来拯救生命;科学过程的民主化;增加地球观测的可及性。 ② 效率与创新:更干净、更安全的代码和更多的贡献者;更多来自社区的长期维护援助;新的货币化办公室和数据中心;财务健全、精简和透明的研究支出。 ③ 再现性:提高研究结果的透明度;更可靠的结果与对之前研究发现的确认;为了发表而提出“令人兴奋”的研究压力变小;更强大的科学方法产品。 ④ 多元化与包容性:国际范围内均可访问;打破了一些系统性的金融和资金障碍;研究人员和科学家之间的多样性;机会的公平 分配。       美国宇航局的“开放科学转型计划”(TOPS)在2022年到2027年之间通过开展一些活动,来加速科学界参与开放科学实践。这些活动的目的主要包括:降低历史上被排斥进入社区的壁垒;更好地了解人们如何使用美国宇航局数据和代码来利用大数据集;增加合作机会,同时促进科学创新、透明度和可复制性。TOPS的任务与NASA 2019-2024年开创性科学数据管理和计算战略、美国国家科学院关于开放科学、可重复性和科学软件的报告以及 2021 年联合国教科文组织关于开放科学的建议草案保持一致。       在TOPS任务中,美国宇航局将2023年定为开放科学年,这是一项全球社区倡议,旨在通过改变当前范式的事件和活动来激发变革并激发开放科学的参与。TOPS只是一个起点,美国宇航局正在作出长期承诺,支持在未来十年内建立一个包容性的开放科学社区。为了支持这项工作,TOPS有三个总体目标: ① 在其任务和研究社区中增加对开放科学原则和技术的理解和采用; ② 通过支持采用开放科学加速重大科学 发现; ③ 扩大历史上被排斥社区的参与。