《英国商业、能源和工业战略部发布报告:《智能开放科学:COVID-19大流行期间的病毒基因组数据共享》》

  • 来源专题:科技期刊发展智库
  • 编译者: 华宁
  • 发布时间:2023-02-20
  •   2022年10月,英国商业、能源和工业战略部(BEIS)发布《智能开放科学:COVID-19大流行期间的病毒基因组数据共享》报告。该报告是关于冠状病毒大流行期间如何跨境共享数据的案例研究,以及应对未来全球紧急情况的最佳实践。

      开放数据共享可以为科学家、公民、政府和企业带来巨大的利益。完全开放的数据(对终端用户没有任何限制)可以消除阻碍快速发展的科学发现、获取和使用方面的摩擦,但一个公平的数据获取和再利用生态系统必须包括合法的界限和适当的激励。在完全开放和有控制的数据共享之间达到智慧的平衡,是七国集团研究契约(G7 Research Compact)(2021年)中“尽可能公开和安全地促进研究数据的有效处理和共享”的承诺的核心所在。

      此研究的目的是利用开放科学应对未来的全球危机。COVID-19大流行是对全球基因组测序能力和测序数据及相关元数据开放共享的一次重大压力测试。在各国寻求摆脱危机的过程中,可以为未来发展吸取相关经验。

      虽然在COVID-19大流行期间,基因组测序数据的分享比以往任何时候都要迅速和广泛,但在许多情况下,分享的时间太晚或分享的形式太片面,因此无法支持应急反应。人们普遍认为,现有的数据共享规范不能很好地适应以近乎实时共享为目标的紧急情况。

      在英国担任七国集团主席国期间做出开放科学的承诺后,BEIS委托进行这项研究。该研究旨在为现有的关于跨境数据共享以及相关研究实践和文化问题的建议增加深度和精度。它借鉴了通过与专家决策者、基础设施提供者和研究人员的访谈和焦点小组所收集的证据,为利用开放科学应对未来的全球危机提供参考。就测序信息的创建和共享提出具体建议,则不在本研究范围之内。

相关报告
  • 《基于全基因组数据解析新型冠状病毒的演化和传播》

    • 来源专题:新发突发疾病(新型冠状病毒肺炎)
    • 编译者:蒋君
    • 发布时间:2020-02-25
    • 中国科学院西双版纳热带植物园联合华南农业大学和北京脑科中心的科研人员一起收集了全世界各领域共享到GISAID EpiFluTM数据库中覆盖了四大洲12个国家的93个新型冠状病毒样本的基因组数据(截止2月12日),通过全基因组数据解析,追溯传染源及扩散路径。 2019年12月在湖北武汉爆发了一种新型冠状病毒(SARS-CoV-2)所致的肺炎(现称COVID-19),新型冠状病毒爆发已两个多月,确定华南海鲜市场是不是唯一的发源地,对于寻找病毒的来源,以及确定中间宿主,对疫情的控制和避免再次爆发具有至关重要的意义。中国科学院西双版纳热带植物园联合华南农业大学和北京脑科中心的科研人员一起收集了全世界各领域共享到GISAID EpiFluTM数据库中覆盖了四大洲12个国家的93个新型冠状病毒样本的基因组数据(截止2月12日),通过全基因组数据解析,追溯传染源及扩散路径。研究发现,收到的93个样本包含58种单倍型,可以归纳为五组,包括3个古老超级传播者单倍型(H1,H3和H13)和2个新的超级传播者单倍型(H56和mv2);华南海鲜市场的新型冠状病毒是从其他地方传入进来,在市场中发生快速传播蔓延到市场之外;同时,现扩散的病例至少来自于3个途经。新型冠状病毒在2月12日之前发生过2次明显的种群扩张(分别是12月8日和1月6日)。   华南海鲜市场的新型冠状病毒是从其他地方传入的   基于120个变异位点得到58种单倍型(基因类型),单倍型演化关系显示,单倍型H13和H38是比较“古老的”单倍型,通过一个中间载体(mv1,可能是一个祖先单倍型,可能是来自中间宿主或者“零号病人”)与蝙蝠冠状病毒RaTG13关联,并通过单倍型H3衍生出了单倍型H1。与华南海鲜市场有关联的患者样品单倍型都是H1及其衍生的单倍型H2,H8-H12(图1,A),而一份武汉样品单倍型H3与华南海鲜市场无关。可见,华南海鲜市场的新型冠状病毒是从其他地方传入进来,在市场中发生快速传播蔓延到市场之外。另外,根据病患发病时间记录和种群扩张时间推断,也印证了华南海鲜市场不是病毒发源地的推论。 对“古老的”单倍型H13和H38的病毒样品溯源发现分别是来自深圳的病患(广东首例)和美国华盛顿州的病患(美国首例)。他们的旅行记录表明应该都是2019年12月底至2020年1月初在武汉探亲期间被感染的。现有武汉样本中没有检测到H13和H38单倍型,可能是因为现有样品主要采自几家定点医院,而且样品采集时间局限于2019年12月24日和2020年1月5日。如果能在武汉其他医院早期的病患检测到这两种单倍型,将对于寻找病毒来源非常有帮助。   新型冠状病毒在2月12日之前发生过2次明显的种群扩张   根据新型冠状病毒基因组数据推算1月之前的种群扩张发生时间是12月8日,该结果暗示病毒可能在12月初,甚至11月下旬即已经开始有人际传播,随后在华南海鲜市场加快了人际传播。研究推算2月份之前的种群扩张时间在1月6日,这个可能与元旦假期有关联。需要指出,这一天国家疾控中心发布了2级应急响应。当时的预警起到了一些警示作用,公众活动和出行都有所减少。如果当时的警示能引起大众更广泛的重视,那么1月份中下旬向全国和全球蔓延的病例会有所降低。研究人员进一步确认我国其他9个省区和其他11个国家的感染病例基本都是从武汉直接或者间接输入而来。   现扩散的病例至少来自于3个途径   为了能够细分来源,研究人员将58种单倍型分成了五组,采用标准是3个中心(古老超级传播者)单倍型(H1,H3和H13)和2个新的超级传播者单倍型(H56和mv2)。以此鉴别出广东的病毒可能有三个来源,重庆和台湾的病毒有两个来源。其中,广东深圳一家人在早期就通过人传人进行了传播。有较多样本的澳大利亚、法国、日本和美国,他们的患者感染源至少有两个,尤其是美国包括了五个来源。非常值得关注的是H56这个超级传播者单倍型,它同时是澳大利亚、法国和美国,以及我国台湾患者的传染源。其他国家患者因为样品比较少,大多数的来源比较单一,他们除了是武汉旅游输入或在武汉感染外,有一些人可能是在广东、新加坡等地被感染。   新型冠状病毒基因组尚未发生重组事件   研究人员发现新型冠状病毒基因组没有发生重组事件,93个基因组之间有120核苷酸发生了突变(0.41%序列长度),并均匀分散在10个编码区(χ2=1.958, df=9, P=0.99)。120个突变的核苷酸关联了119个氨基酸密码子,其中79个密码子 (65.83%)改变了氨基酸类型,并有42个(53.17%)氨基酸理化性质都被改变。这些氨基酸类型以及理化性质改变是否会影响新型冠状病毒的活性暂不清楚,需要其他蛋白组学和结构生物学方面的专业人士进行验证。本研究是版纳植物园综合保护中心生物多样性研究组的科研人员利用其在系统与演化领域的专长开展的,本研究提到单倍型演化关系分析方法可以结合到传染病学研究中,对于寻找传染源,以及精确的传播和扩散方向能提供非常重要的信息。
  • 《Digital Science发布《2020年开放数据状况》报告》

    • 来源专题:科技大数据监测服务平台
    • 编译者:zhoujie
    • 发布时间:2020-12-07
    • 《开放数据状况报告》是目前持续时间最长的纵向研究,该研究创建于2016年,旨在考察研究人员使用开放数据的态度和经验--共享数据、重复使用和重新分配数据。 今年的调查收到了来自研究界的约4,500份答复,并额外关注COVID-19大流行后的研究实践。调查询问研究人员,新冠大流行如何影响他们开展研究的能力,以及他们对数据再利用和合作的看法。 关键的COVID-19调查结果包括: 三分之一(32%)的学术研究人员报告说,他们的研究受到COVID-19爆发的“极端”或“非常”影响。 受COVID-19影响最大的学科是化学(47%),生物学(39%),医学(36%)和材料科学(36%)。在人文和社会科学领域,报告的影响程度最低(20%)。 43%的被调查者已经或可能在一定程度上将其拨款重新用于COVID-19研究。 一半的受访者认为,封锁可能会导致其他实验室提供的开放数据的重复使用,65%的受访者希望重用自己的数据。 超过三分之一的研究人员表示,他们希望COVID-19能带来更多的合作;对于巴西和印度等国家的研究人员来说,COVID-19对研究的影响似乎很大,约有一半的研究人员预计合作会因此而增加。 其他主要发现: 从未制定数据管理计划的受访者数量从30%减少到15%。 2018年,60%的受访者从未听说过FAIR原则,今年这个数字下降到39%,整体熟悉度从15%上升到24%。 55%的受访者认为共享数据应成为授予资助的要求之一。 29%的受访者不知道由谁承担开放研究数据的费用。 只有13%的受访者认为研究人员目前获得了足够的声誉(credit)来共享数据,而59%的受访者认为他们获得的声誉(credit)太少了。 来源: https://www.digital-science.com/blog/news/the-state-of-open-data-2020/