《Science | 利用 Evo 进行从分子到基因组规模的序列建模和设计》

  • 来源专题:战略生物资源
  • 编译者: 朱晓琳
  • 发布时间:2024-11-16
  •   2024年11月15日,Arc研究所的 Patrick D. Hsu 和 Brian L. Hie 团队在国际顶尖学术期刊 Sciencce 上发表了题为:Sequence modeling and design from molecular to genome scale with Evo 的研究论文,该论文还被选为当期的封面论文。


      该研究开发了从分子到基因组尺度都能进行预测和生成任务的基因组基础模型——Evo模型。这是第一个在全基因组规模上以单核苷酸分辨率预测和生成DNA序列的模型。

      通过对整个基因组信息进行学习,Evo模型能够学习微小的核苷酸序列变化如何影响整个生物体的适应性,从而预测哪些基因对于生物体至关重要,还能够生成长度超过百万碱基对的具有合理基因组结构的DNA序列。研究团队还使用Evo模型生成了CRISPR-Cas分子复合物和IS200/IS605转座子,并验证了它们的功能活性,这也是首次通过语言模型实现蛋白质-RNA和蛋白质-DNA协同设计的实例。


  • 原文来源:https://www.science.org/doi/10.1126/science.ado9336
相关报告
  • 《Nature Microbiology:最大规模的海洋微生物基因组研究》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:mall
    • 发布时间:2017-09-24
    • 微生物主宰着地球生命,并与海洋密切相关:促进了整个海洋食物链的运作。8月14日发表在《自然微生物学》(Nature Microbiology)的一篇报告中,夏威夷大学(UHM)海洋学教授Ed DeLong和他的团队研究出迄今为止最大的微生物组基因目录。基于这些新信息,研究小组发现营养限制是海洋微生物基因组进化的核心驱动力。 作为一个庞大的群体,海洋微生物在新陈代谢能力方面千差万别,所有的差异性都被编码在它们的基因中。一些海洋微生物的遗传编码允许它们利用从阳光中获得的能量将二氧化碳转化为有机物。另一些微生物将有机物质作为碳和能量的来源,产生二氧化碳这种呼吸终端产品。不仅如此,人们也发现了其他更为奇特的新陈代谢途径。 “一勺海水就有近一百万个细胞,我们如何在几乎不可见的生物中描述这些不同的特性和功能呢?” “一个来自夏威夷群岛以北海水中收集的微生物的基因目录可以解答上述疑问。研究团队参与了“夏威夷海洋时间序列项目(Hawai'i Ocean Time-series Program)”,他们持续在ALOHA站收集海水样本做基因组测序已经超过2年的时间。 在阳光照不到的深层海水中,研究小组观察到了微生物群落信息的急剧变化。在大约250-650英尺之间,微生物的基本组成部分,即基因组和蛋白质发生了巨大的变化。海面附近微生物的基因组要小得多,其蛋白质含氮量也较少。而在更深的海域,400-650英尺范围内,微生物基因组会变得更大,它们的蛋白质也含有更多的氮,同时随着深度的增加,氮的含量也会增加。这些结果表明,海洋环境中的营养物质可能会驱动微生物基因组和蛋白质的进化。”这项研究的另一个令人惊奇的发现是,在阳光照射下,微生物的“基因组过渡区”发生在一个非常狭窄的深度范围内。在大约650英尺深的海底,微生物基因组和蛋白质的基本特性是相对稳定的。” “该研究的新数据将为我们了解海洋微生物群落性质及其功能提供重要工具,同时也有助于预测未来的发展轨迹。” DeLong说。 (刘思青 编译) 原文链接:https://www.nature.com/articles/s41564-017-0008-3
  • 《Nature Genetics报道大规模肺癌易感性全基因组研究》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:黄翠
    • 发布时间:2017-07-25
    • 利物浦大学John Field教授领导的一个国际肺癌研究小组进行了一项研究,鉴定了一种新肺癌风险基因突变。他们的这项最新发现发表于Nature Genetics杂志。 肺癌对世界癌症死亡率的贡献一直“傲视群癌”。虽然普遍认为吸烟是造成肺癌的主要危险因素,但据估计仍有12%的病例发于基因组成变异。过去我们并不知晓这些基因变异的确切细节。 基因分型(genotyping)是通过检测个体DNA序列来确定个体基因组成(基因型)差异的实验过程。 一个名叫“OncoArray”的特殊研究平台专门收集世界各地的基因型数据,全世界的研究人员持续不断地增加该平台的样本数量,使其成为了世界最大的基因型数据平台。其中利物浦肺癌专项为这项庞大的国际工程做出了重大贡献。 发表在Nature Genetics杂志中的这项研究通过GWAS对29200例肺癌患者和56000例非肺癌患者(对照组)样本进行了基因筛查。更新了18种容易引发肺癌的遗传变异(包括胆碱烟碱受体、CHRNA2、 以及端粒相关基因OFBC1和RTEL1在内的基因位点),还有10种新基因突变(如RNASET2、SECISBP2L和 NRG1等)。