2022年是GigaScience推出10周年。10年间,他们深入推动了开放科学和开放数据,并创建了数据存储库GigaDB。同时,GigaScience还推行了一系列活动如:遵循FAIR原则,推广预印本,并实施强制性的公开同行评审等。
(1)GigaByte获得ALPSP出版创新奖
GigaByte与RiverValley Technologies开展合作,逐步推进文章成为“活的文件”(living documents),并已实现了文章三种语言(英语、西班牙语和乌克兰语)版本的任意切换。基于此,GigaByte和RiverValley获得了2022年ALPSP出版创新奖,以表彰其在学术出版方面的贡献。
(2)关于10年进展的评论
作为10周年活动的一部分,GigaScience邀请了一系列评论以全面回顾10年来大规模研究的进展。开放科学已经获得了良好的发展势头,征集的评论反映了各个领域已经取得的成就和未来的发展方向。主题包括保护遗传学、神经信息学以及计算病理学等。
GigaScience的数据治理团队报告了GigaDB资源在数据量、数据可发现性和数据再利用方面保持持续增长,并讨论了数据管理在提高用户体验方面的作用。
数据应该开放的主要原因之一是让其他研究人员有机会在新的项目中重新使用这些信息,而且往往是在完全不同的研究背景下。“研究寄生虫奖”(以医学杂志上一篇有争议的社论命名)用以表彰那些通过使用现有数据集做出杰出贡献的科学家。
(3)GigaByte调动了超过50万条生物多样性记录
2022年的另一个亮点是与全球生物多样性信息设施(GBIF)合作,在GigaByte上发表了一系列关于人类疾病病媒的数据论文。这一系列论文得到了世界卫生组织主办的热带疾病研究和培训特别计划的支持。病媒传播的疾病占人类传染病病例的17%以上,但是与这些病媒有关的信息存在巨大缺口,这就产生了共享数据的基本需求,数据论文的出版是克服这一挑战的有效工具。
该论文集的第一组GigaByte论文调动了50多万条记录,以及来自50多个国家的67.5万个标本。该系列目前已经进入第二轮。
(4)机器学习时代已经到来
机器学习正在渗透到各个研究领域,GigaScience发表的一项研究旨在剖析机器学习模型在免疫学中的作用,特别是分析适应性免疫受体库。
随着机器学习相关论文数量的不断增加,GigaScience也提高了该类文章的标准,关注那些在可重复性和透明度方面遵循最佳实践的机器学习的相关工作,这意味着需要分享数据和开源代码。除了FAIR原则,GigaScience也将更加关注于专门针对机器学习领域的建议,如DOME-ML指南。
Gigascience和GigaByte致力于数据的透明性与开放性出版,机器学习技术将为期刊中的数据带来新的应用。在科学界和学术出版界,人工智能革命已经开始。