2015年至2016年寨卡病毒(Zika)爆发期间,公共卫生官员争相控制疫情,遏制该病原体对孕妇的破坏性影响。与此同时,世界各地的科学家试图了解这种神秘病毒的基因。
问题是,病人血液中寨卡病毒颗粒并不多。在临床样本中寻找它就像在海洋中捕捉小鱼一样困难。
由布罗德研究所的科学家开发的一种新的计算方法有助于克服这一障碍。布罗德研究所(Broad Institute)研究人员帕迪斯·萨贝蒂(Pardis Sabeti)的实验室建立了这种“捕捉”方法,可用于设计任何已知感染人类的病毒及其所有已知毒株的分子“诱饵”,包括临床样本中含量较低的病毒,如寨卡病毒。这种方法可以帮助全球范围内的小型测序中心更有效、更经济地开展疾病监测,为控制疫情提供关键信息。
这项新研究由麻省理工学院研究生海登·梅茨基和博士后凯蒂·西德尔领导,研究结果发表在《自然生物技术》的网站上。
“基因组测序成为疾病监测的关键部分,捕捉等工具将帮助我们和其他人发现疫情,病原体产生更多的数据可以共享与更广泛的科学和医学研究社区,“基督教Matranga说,这项新研究的文章的第二作者加入了当地的生物技术公司。
科学家们已经能够通过分析临床样本中的所有遗传物质来检测出一些低丰度的病毒,这种技术被称为“宏基因组测序”(metagenomic sequencing),但这种方法往往会遗漏在大量其他微生物和患者自身DNA中丢失的病毒物质。
另一种方法是“丰富”针对特定病毒的临床样本。为此,研究人员使用一种遗传“诱饵”固定目标病毒的遗传物质,这样其他遗传物质就可以被冲走。萨比提实验室的科学家们成功地使用了诱饵来分析埃博拉和拉沙病毒的基因组。诱饵是一种分子探针,由短链RNA或DNA与样本中的病毒DNA片段配对而成。然而,这些探针总是针对一种微生物,这意味着它们必须确切地知道自己在寻找什么,而且它们的设计并不严谨、高效。
他们需要的是一种设计探针的计算方法,这种方法能够提供临床样本中各种微生物含量的全面视图,同时也能对寨卡病毒等低丰度微生物进行富集。
“我们想重新思考我们实际上是如何设计探测器来进行捕获的,”Metsky说。“我们意识到,我们可以用比以前更少的探针来捕获病毒,包括它们已知的多样性。”为了使其成为一种有效的监测工具,我们决定尝试一次锁定20种病毒,最终我们将已知的356种感染人类的病毒数量扩大到356种。
CATCH是“用于综合杂交的目标的紧密聚合”的缩写,它允许用户设计定制的探针集来捕获任何微生物物种组合的遗传物质,包括病毒,甚至是已知感染人类的所有病毒的所有形式。
要真正全面地运行CATCH,用户可以很容易地输入已上传到国家生物技术信息中心GenBank序列数据库的各种形式的所有人类病毒的基因组。该程序根据用户想要恢复的信息来确定最佳探测集,无论这些信息是病毒还是一个子集。探针序列列表可以发送到少数几个合成探针进行研究的公司之一。科学家和临床研究人员希望检测和研究这些微生物,然后可以使用像鱼钩一样的探针来捕获所需的微生物DNA进行测序,从而为感兴趣的微生物富集样本。
用CATCH设计的探针组测试显示,富集后,病毒含量占测序数据的比例是富集前的18倍,这使得该团队能够组装无法从未富集样本中生成的基因组。他们检测了包含8种病毒的30个已知样本,验证了该方法的有效性。研究人员还表示,2018年尼日利亚拉沙病毒(Lassa)爆发时,如果不进行富集,很难对拉沙病毒样本进行测序,而使用一套由catch设计的针对所有人类病毒的探针,可以“拯救”这些样本。此外,该小组还能够改进对来自患者和蚊子的未知含量样本的病毒检测。
利用CATCH, Metsky和他的同事们生成了针对寨卡病毒和基孔肯雅病毒的病毒探针子集,基孔肯雅病毒是在同一地理区域发现的另一种蚊媒病毒。除了用其他方法生成的寨卡病毒基因组外,他们使用由catch设计的探针生成的数据,帮助他们发现,在科学家能够检测到寨卡病毒之前,该病毒已经在几个地区传播了数月,这一发现可以为控制未来疫情的努力提供信息。
为了演示CATCH的其他潜在应用,Siddle使用了一系列不同病毒的样本。Siddle和其他人一直在与西非的科学家合作,建立实验室和工作流程,以便现场分析病原体基因组。西非的病毒爆发和难以诊断的发烧很常见。Siddle说:“我们希望我们在尼日利亚的合作伙伴能够有效地从不同的样本中进行宏基因组测序,而CATCH帮助他们提高对这些病原体的敏感性。”
这种方法也是一种强大的方法来调查未确诊的发烧与疑似病毒的原因。Siddle说:“我们对使用宏基因组测序来阐明这些病例的潜力感到兴奋,特别是在受影响国家的地方这样做的可能性。”
CATCH方法的一个优点是它的适应性。随着新的突变被识别,新的序列被添加到GenBank,用户可以快速地重新设计一组具有最新信息的探针。此外,虽然大多数探头的设计都是专有的,但Metsky和Siddle已经公开了他们用CATCH设计的所有探头。用户可以在CATCH中访问实际的探针序列,允许研究人员在合成探针之前探索和定制探针设计。
Sabeti和其他研究人员对渔获物改善大规模高分辨率微生物群落研究的潜力感到兴奋。他们还希望这种方法有朝一日能在诊断应用中发挥效用,将结果返回给患者,让他们做出临床决定。就目前而言,该技术在改善寨卡病毒和拉沙病毒等病毒暴发的基因组监测,以及其他需要全面了解低水平微生物含量的应用方面的潜力,令他们感到鼓舞。
CATCH软件可以在GitHub上公开访问。在Sabeti和Matranga的监督下,它的开发和验证在《自然生物技术》的网站上进行了描述。