《Science | 人类基因组转录起始的序列基础》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2024-04-29
  • 2024年4月26日,得克萨斯大学西南医学中心的研究人员在 Science 期刊发表了题为Sequence basis of transcription initiation in the human genome的文章。

    转录起始是确保任何基因正常功能必不可少的一个过程,但我们仍然缺乏对序列模式和规则的统一认识,而这些模式和规则可以解释人类基因组中的大多数转录起始位点。

    通过利用深度学习启发的可解释模型 Puffin 以碱基对分辨率预测序列中的转录起始点,研究人员发现一小套简单的规则就能解释大多数人类启动子的转录起始点。研究人员确定了有助于人类启动子活性的关键序列模式,每种模式都以不同的位置特异性效应激活转录。此外,研究人员还解释了启动子双向转录的序列基础,确定了不同细胞类型启动子序列与基因表达变异之间的联系,并探索了不同哺乳动物物种转录启动序列决定因素的保护。

  • 原文来源:https://www.science.org/doi/10.1126/science.adj0116
相关报告
  • 《Science:新的里程碑!迄今最完整的人类基因组测序结果公布》

    • 来源专题:生物安全知识资源中心—领域情报网
    • 编译者:hujm
    • 发布时间:2022-04-03
    • Science发布“Completing the human genome”重磅特刊!该特刊整期上线6篇封面文章,首次公布了人类基因组的完整序列。至此,人类完整基因组测序计划正式完成,全球科学家近40年的努力也终收获一个满意的成果。这项跨越3年的研究成果,填补了多年前的测序空白,是人类基因组测序研究的重大里程碑,将彻底改变我们对人类基因组变异、疾病和演化的理解。 Science上线的特刊“Completing the human genome”[1]中包括6篇研究论文(图1),其中一篇是主论文,其他5篇论文分别从5个方面探讨了该完整基因组在人类遗传学上的重要性。5篇论文中的第一篇主要研究segmental duplication等复杂区域;第二篇论文重点介绍了中心粒的结构和其表观图谱;第三篇论文讨论的是该完整基因组如何提高对人类遗传变异多样性的分析;第四篇论文说明了人类基因组重复序列中的基因表达和其表观图谱;第五篇论文介绍了该完整基因组的表观图谱。 2022年4月1日,第一个完整的、无间隙的人类基因组序列发布,这是继1983年人类基因组计划公布第一个人类基因组序列草案以来的首次再突破。据研究人员称,人类DNA中拥有大约30亿个碱基的完整、无间隙序列,其对于了解人类基因组变异的全谱以及了解对某些疾病的遗传至关重要。因此,科学家们于1990年启动人类基因组计划,并且于2003年完成。但是,当时只是完成了92%的人类基因组测序,未完成的8%,一直受限于DNA测序技术。随着DNA测序技术的发展,国际科学家团队——Telomere to Telomere(T2T)联盟的科学研究,彻底填补多年前的测序空白。 新的参考基因组称为T2T-CHM13,它是增加了近2亿个碱基对的新DNA序列,其中包括99个可能编码蛋白质的基因和近2000个需要进一步研究的候选基因(图2)。此外,它还纠正了当前参考序列中的数千个结构错误。由新序列填补的空白包括五个人类染色体的整个短臂,覆盖了基因组中一些最复杂的区域[2]。例如染色体末端的端粒和在细胞分裂过程中协调同源染色体或姐妹染色单体分离的着丝粒。新序列还揭示了以前未检测到的片段重复(在基因组中重复的长段DNA),这些重复片段可在进化和疾病中发挥重要作用。 T2T基因组序列代表完成的CHM13基因组加上最近完成的T2TY染色体(CHM13包括X染色体但不包括Y染色体),是UCSC Genome Browser(简称“Browser”)中的新参考基因组。T2T序列在Browser中的完全注释为科学家提供了一种有效的方式,来访问和可视化与基因组和基因组其他元素相关的大量信息。如今有了完整的基因组,科学家就能进一步研究该片段在人类种群中的多样性以及导致疾病的精细遗传点。因此,本次测序工作最大的意义在于通过长读测序技术解决复杂区域的序列结构,为后续的精准医疗和分子诊断提供更为精细的索引[3]。 该完整基因组的构建不仅提供了人类基因组模板,更重要是该技术手段将迅速被应用到以基因组学为手段的生物学研究中(图3)。 对于演化基因组学研究来说,此后可拥有较好的人类基因组学模板来研究人类特有的基因片段和人类复杂区域的遗传多样性。特别是对于灵长类演化研究来说,对于我们理解人类和非人灵长类在复杂区域的基因组异质性,有着重要的意义。同时,对于演化研究和基因组学研究来说,研究人员以后可以在单核苷酸水平上去观察中心粒的完整结构,理解中心粒的结构变异和演化。进一步探究中心粒在基因组稳定性中的作用,以及不同疾病中基因组不稳定性和这些复杂区域的关系。 中国科学院北京基因组研究所博导蒋岚表示,国家二孩三孩政策的相继推出,使得提高人口出生率和人口健康成为国民关注的问题。高龄产妇生育能力下降、难受孕、易流产,与卵细胞和早期胚胎的着丝粒区域异常的表观遗传学状态密切相关。着丝粒区域富含复杂的高度重复序列,在之前的基因组参考序列中留下许多空洞。因此,我们对于人类基因组着丝粒区域的表观遗传学的理解是不完整的。而此次报道的无缝隙人类基因组参考序列,结合三代测序等新技术来研究表观遗传学修饰特别是DNA甲基化,有望克服这个瓶颈。故该成果对于推动辅助生殖技术的发展,也具有重要意义。 此外,科学家也能免费使用该数据去研究其他生物学问题。事实上,在本论文正式发表之前,就已经惠泽更多课题组,日本科研团队已使用T2T联盟此前发表在预印本上的论文数据做出了研究成果。专家表示这些研究加强了我们对于人类基因组的基本认识,同时该技术的创新给我们带来更多的研究方向。未来通过获得不同人类种群T2T基因组来进一步精细研究人类起源和人类基因组多样性将会是很重要的课题。因此,美国国立卫生研究院专门拨款3000万美元经费支持研究团队完成350个人类T2T水平的二倍体基因组测序组装工作。该工作将构建非洲、亚洲、欧洲和美洲等各个不同人群的泛基因组图谱。这个泛基因组图谱将会极大影响我们对人类演化和人类遗传多样性的理解,同时该图谱也会对各类疾病的研究起到至关重要的作用。
  • 《Science:发现人类基因组中的古老病毒DNA可以防止现代病毒的感染》

    • 来源专题:生物安全知识资源中心—领域情报网
    • 编译者:hujm
    • 发布时间:2022-11-09
    • 根据一项新的研究,人类基因组中的病毒DNA是在古代感染病毒时嵌入的,可以作为抗病毒剂,保护人类细胞免受某些现代病毒的侵害。相关研究结果发表在2022年10月28日的Science期刊上,论文标题为“Evolution and antiviral activity of a human protein of retroviral origin”。 以前的研究已表明,小鼠、鸡、猫和羊的基因组中的古老病毒DNA片段---内源性逆转录病毒---通过阻止源自体外的现代病毒进入宿主细胞而对它们产生免疫力。尽管这项新的研究是在实验室中利用体外培养的人类细胞开展的,但它表明内源性逆转录病毒的抗病毒作用很可能对人类也存在。 这项新的研究很重要,因为进一步的研究可能会发现一系列天然抗病毒蛋白,导致没有自身免疫副作用的治疗。它揭示了可能存在一种基因组防御系统,这种防御系统尚未被鉴定,但可能相当广泛。 论文通讯作者、美国康乃尔大学农业与生命科学学院分子生物学与遗传学教授Cedric Feschotte说,“这一结果显示,在人类基因组中,我们有一个蛋白库,有潜力阻止广泛的病毒。” 内源性逆转录病毒约占人类基因组的8%---至少是构成蛋白编码基因的DNA数量的四倍。为了让逆转录病毒进入宿主细胞,病毒包膜蛋白与宿主细胞表面的受体结合,就像一把钥匙插入一把锁。逆转录病毒将它们的RNA引入宿主细胞,然后它们的RNA经逆转录后转化为DNA并整合到宿主的基因组中。宿主细胞遵循它们的基因指令,制造更多的病毒。 通过这种方式,病毒劫持了细胞的转录复合物来进行自我复制。通常情况下,逆转录病毒感染的细胞不会代代相传,但有些逆转录病毒感染生殖细胞,如卵子或精子,这就为逆转录病毒DNA从亲代传给后代并最终在宿主基因组中持续存在打开了大门。 在这项新的研究中,这些作者使用计算基因组学来扫描人类基因组,并对所有可能保留受体结合活性的潜在逆转录病毒包膜蛋白编码序列进行分类。他们随后进行了更多的测试,以检测这些基因序列中哪些是活跃的,即在特定的人类细胞类型中表达逆转录病毒包膜基因。 Feschotte说,“我们发现了明确的表达证据,表明许多逆转录病毒包膜基因在早期胚胎和生殖细胞中表达,还有一部分在感染时的免疫细胞中表达。” 一旦这些作者确定了在不同情况下表达的抗病毒包膜蛋白,他们就把重点放在了一种叫Suppressyn的蛋白上,因为已知它能结合一种称为ASCT2的受体,该受体是一组称为D型逆转录病毒的病毒的细胞进入点。Suppressyn在胎盘和非常早期的人类胚胎发育中显示出高水平表达。 他们随后在人类胎盘样细胞中进行了实验,因为胎盘是病毒的一种常见的入侵目标。这些细胞被暴露在一种叫做RD114的D型逆转录病毒中,已知该病毒会天然地感染猫科动物,如家猫。虽然其他不表达Suppressyn的人类细胞类型很容易被RD114感染,但胎盘和胚胎干细胞却没有被RD114感染。当他们通过实验提出胎盘细胞的Suppressyn时,它们变得容易受到RD114的感染;当让这些细胞重新表达Suppressyn时,它们又恢复了抵抗力。 此外,这些作者做了相反的实验,使用通常对RD114敏感的胚胎肾细胞系。当他们通过实验将Suppressyn引入这些细胞时,这些细胞变得对这种病毒有抵抗力。 这项新的研究显示了一种源自逆转录病毒的人类蛋白如何阻断一种细胞受体,该细胞受体允许一系列在许多非人类物种中流通的逆转录病毒进入和感染宿主细胞。Feschotte说,通过这种方式,整合到人类基因组中的古老逆转录病毒提供了一种保护发育中的胚胎免受相关病毒感染的机制。他说,未来的研究工作将探索人类基因组中编码的其他包膜蛋白的抗病毒活性。 参考资料: John A. Frank et al. Evolution and antiviral activity of a human protein of retroviral origin, Science, 2022, doi:10.1126/science.abq7871.