《陈鹏团队实现活细胞中染色质化学修饰的编码表达与串联解析,芝加哥大学何川教授作点评》

  • 来源专题:转基因生物新品种培育
  • 编译者: 姜丽华
  • 发布时间:2023-03-08
  • 2023年3月2日,北京大学化学与分子工程学院陈鹏教授研究团队与生命科学学院季雄教授课题组在《细胞》( Cell )杂志发表了题为“Linking chromatin acylation mark-defined proteome and genome in living cells”的研究论文,发展了在活细胞内“关联解析”蛋白质化学修饰机制与功能的“单位点-多组学”技术-SiTomics,揭示了受染色质酰化修饰介导的丰富的相互作用组学信息,建立了表观遗传调控的蛋白质组与基因组“信息关联”。

    1988年,加州大学洛杉矶分校Michael Grunstein教授团队发现,真核细胞中的核小体不仅仅是供DNA缠绕的结构,它在调节基因表达上还有着重要作用1。此后,随着表观遗传学先驱David Allis教授在1996年对组蛋白尾部修饰酶的突破性发现2和2001年提出的Histone Code假说3,人们对染色质结构与基因转录调控之间关系的理解进入了崭新的一页。在一系列组蛋白新修饰被鉴定4的同时,人们迫切地想知道这些特异性修饰的性质和功能有何异同,又是如何调控基因表达的?例如,越来越多的证据表明,来自环境的代谢物会通过染色质的化学修饰实现基因转录调控5,但作为表观遗传调控的重要分子基础,人们对很多化学修饰,尤其是位点特异、双向可逆的动态修饰对基因表达调控的影响尚不清楚,亟需对这些多层次的表观遗传信息加以解析和关联。

    传统的生物学方法往往借助抗体的特异识别来原位研究蛋白质的翻译后修饰,而化学生物学技术能够实现活体环境下的高选择性和时空特异研究,具有独特的优势。在这一工作中,作者借助遗传密码子拓展策略,发展了一种具有单氨基酸位点分辨率的多组学技术Single-site-resolved multi-omics(SiTomics,图1)。通过将一系列带有赖氨酸酰化修饰的“光交联”非天然氨基酸,以位点特异的方式引入活细胞内的组蛋白当中,原位模拟内源修饰在基因组上的分布,并与蛋白质光交联和组学鉴定技术、基因组测序技术等相结合,他们系统性地开展了由位点特异的化学修饰介导的染色质相互作用蛋白质组与基因组“关联鉴定”。利用SiTomics技术,他们首先鉴定出H3K56位点在短链脂肪酸代谢物的刺激下会发生显著的酰化修饰,进而获得了受H3K56酰化修饰介导的相互作用蛋白质组和基因组,建立了二者之间的直接关联。他们的工作还揭示了超级增强子(super-enhancer)在细胞“代谢-修饰-基因转录”调控轴中发挥的重要作用。

    “单位点分辨”的动态修饰定量鉴定

    组蛋白修饰位点众多,不同位点对代谢物响应程度的定量比较,会因不同多肽对质谱响应的差异而难以实现。在之前的研究中,人们往往利用同位素标记的代谢物处理细胞并鉴定同位素标记的修饰肽段,但这样的方法会损失一些动态变化信息,尤其是对修饰量减少或者原有修饰经擦除后重新被修饰的情况,都难以提供丰度信息。利用SILAC技术标记赖氨酸和精氨酸,整合平行比较同样长度、修饰和电荷数的同一肽段的变化情况,可以更为精准地定量比较修饰的动态变化(Site-Profiling, I)。最终,通过加权分析,作者鉴定出H3K56位点在短链脂肪酸(如巴豆酸、β-羟基丁酸)处理下都显著地发生了相应的酰化修饰。

    “非天然氨基酸”可于活细胞中“连接”表观遗传信息

    如何在活细胞内实现染色质化学修饰的原位模拟?基于遗传密码子拓展的非天然氨基酸技术的优点正在于此。天然赖氨酸的光活性类似物-photolysine能够维持修饰状态与体内的赖氨酸修饰一致(图2),而遗传密码子拓展技术的生物“正交性”使得带有翻译后修饰的photolysine能够定点特异地引入组蛋白当中。借助这些“可遗传编码”的非天然氨基酸,带有特异修饰的组蛋白就可以通过其末端的富集标签,结合“光交联”蛋白组学技术(Site-Link, II)和传染色体免疫共沉淀-测序技术(Site-Seq, III),实现其相互作用蛋白质组及在染色体中定位的协同鉴定。

    那么,定点引入翻译后修饰的组蛋白是否能够稳定存在并被整合入染色体当中?被整合入染色体中的组蛋白修饰又去了什么样的位置?有没有干扰细胞内原始的修饰状态?和内源产生的修饰在基因组的分布又是否一致?这样得到的功能性发现又是否与实际状态一致呢?为了回答这些问题,作者设计、合成和开发了分别含有6种修饰(Kac, Kpr, Kbu, Kcr, Khib, Kbhb;K*ac, K*pr, K*bu, K*cr, K*hib, K*bhb)或1种对照(PABK与PABK*,通过TCO小分子原位decage出无修饰的K与K*)的共计14个“非天然氨基酸”探针(图3),均实现了组蛋白H3中相应赖氨酸修饰位点的定点插入。利用一系列表征手段,分别对带有特异修饰的组蛋白表达、分布位置、插入位点等进行了确证。同时,利用重标氨基酸探针确证了修饰基团在细胞中的稳定存在时间。这些详实的数据确证了带有定点翻译后修饰的组蛋白能够在活细胞内稳定存在并被有效整合入染色体当中。

    互作蛋白质组与染色质分布的“协同解析”

    作者将Site-Link技术应用于H3蛋白的K37, K56和K79等位点(H3K*56ac,H3K*56cr,H3K*56bhb,H3K*56PABK*,H3K*37cr,H3K*79cr),利用对这些带有光交联探针的组蛋白进行交联-富集和质谱鉴定,他们获得了不同位点/修饰的相互作用蛋白质组信息,发现不同“位点-修饰”组合的确具有独特的相互作用蛋白质组。

    接下来,作者对巴豆酰化修饰进行了细致的研究(图4)。与H3K4me3一样,赖氨酸的巴豆酰化修饰(Kcr)被报道分布于基因组启动子区域。将SiTomics技术应用于H3K56cr的研究,作者确实捕获到一系列报道与H3K4me3相互作用的蛋白质,且随机选取H3K4me3在基因组中分布的位点能够验证H3K56cr也分布在这些位置。另外,他们发现H3K56cr具有一个非常特异的相互作用蛋白-GLYR1,与H3K56位的其他修饰基本都没有结合作用。鉴于之前的报道显示GLYR1分布在基因体(gene body)区域,作者推断GLYR1可能与巴豆酰化在gene body的相对高丰度分布有关。进一步利用“时间分辨”的光交联技术,他们发现在H3K56cr表达量稳定后,GLYR1与之的结合会逐步增加,这在一定程度上解释了H3K56cr是先被整合进入基因组中,再与GLYR1产生相互作用。在得到这些信息之后,作者推断细胞中可能存在着“正交”的“识别-装载”系统,能够协助这些携带有翻译后修饰的组蛋白整合进入染色体的相应位置,从而使这些组蛋白能够“重现”内源修饰在基因组上的分布,其获得的组学数据便是染色质化的蛋白质组和基因组学信息。为验证这一论断,作者随即对赖氨酸的β-羟基丁酰化修饰(Kbhb)进行了更为系统的研究。

    β-羟基丁酰化是与“生酮饮食法”(Keto Diet)最为密切的一个化学修饰,但目前对其的研究报道甚少。将Site-Seq技术应用于β-羟基丁酰化,作者发现带有H3K56bhb修饰的组蛋白并非随机地分布在染色体中,而无修饰的H3K56则相对随机分布。H3K56bhb确实可以增加一些位置的染色体的开放性。进一步的Hi-C测序发现,单位点修饰的H3K56bhb便足以引起染色体三维结构的变化(图5)。

    “单位点-多组学”技术揭示生理情况的染色体调控

    在确认了工具对生理状态的模拟之后,作者接下来将其应用于酮体代谢下的染色体调控研究。他们首先通过免疫荧光发现酮体代谢下的β-羟基丁酰化修饰在细胞核中呈现特异的聚集样分布,这可能预示着细胞核中独特的调控作用。那么,如何快速寻找切入点,发现这样的生物学表型所对应的调控机制呢?他们所开发的“单位点-多组学”工具此时便有利于开启这样的探索。鉴于之前已经发现酮体代谢情况下,H3K56bhb修饰显著增加,则可利用SiTomics工具研究H3K56bhb的相互作用蛋白,并考察在基因组上是否存在特异分布。

    的确,作者发现H3K56bhb与BRD4存在相互作用,同时,H3K56bhb在超级增强子中有显著分布(图6),而作为对照的H3K9bhb则几乎没有分布。作者因此推测可能酮体代谢情况下的染色体调控有超级增强子的参与。

    最后,通过利用Nabhb处理细胞、模拟酮体代谢下细胞内的染色质动态调控情况,作者发现,超级增强子的确发生了显著变化,而且与H3K56bhb的基因组整合位点相一致。此外,β-羟基丁酸处理下,受影响的超级增强子附近的基因其Pol II结合增加,而在H3K56bhb引入的细胞中,这些基因附近的Pol II结合也明显增加。进一步的RNA-seq分析证实这些发生变化的超级增强子可以帮助解释代谢情况下相关基因的高表达现象,从而在分子水平上实现了“代谢-修饰-调控”轴的贯穿(图7)。

    综上所述,SiTomics技术为“关联解析”染色质动态修饰的机制与功能、系统建立和解码表观遗传“关联信息”提供了多组学研究平台,并可适用于组蛋白之外的蛋白质和酰化修饰之外的化学修饰,为深入开展蛋白质动态修饰的机制研究、开发相应的化学干预策略提供了强大的工具平台。

    陈鹏、季雄、北大-清华生命科学联合中心毕业生秦芳菲博士是本文的共同通讯作者;秦芳菲和生命科学学院李伯源博士是共同第一作者。文章返修过程正值北京疫情高峰期,多名同学贡献了自己宝贵的科研时间,展现了团结协作的风貌。

    何川教授(HHMI、芝加哥大学)点评:

    表观遗传研究近年来正在迅猛发展,DNA甲基化、染色质重塑、组蛋白的翻译后修饰、RNA可逆修饰7等都是表观遗传信息的重要载体(https://www.genome.gov/genetics-glossary/Epigenetics)。如何系统性地揭示环境与表型之间由表观遗传介导的动态关系,深入研究其分子机理,这就需要各种基因组学、成像和其它有效的方法的结合。表观遗传调控本质是生物大分子上化学动态修饰的问题。化学的方法来研究表观遗传应该有巨大前景。这篇文章提供了一个非常好的例子。其理论基础就是过去20多年广泛发展起来的生物正交反应体系。比如2022年的诺贝尔化学奖颁给了点击化学与生物正交反应,简单的炔基与叠氮基团的偶联反应,与生物体系兼容且正交,为很多生物学新发现提供了有效的工具。此次陈鹏团队与合作者的这个工作实现了利用遗传密码子拓展技术将组蛋白化学修饰定点“编码”到活细胞的染色质当中。他们系统分析了这些外源引入的化学修饰与生物体系内源修饰的正交性,同时利用光交联的化学手段研究相互作用蛋白质组,并结合传统生物学测序技术鉴定基因组信息,展示了这个技术的巨大前景。

    1. 在技术发展方面,利用“遗传密码子拓展”策略,实现了活细胞内蛋白质翻译后修饰的“编码”研究

    蛋白质的化学修饰通常都是“翻译后”事件,目前只能依赖特异识别某个修饰的抗体加以原位研究,尤其对于不同位点的相同修饰,甚至同一位点上化学结构相近的不同修饰,经常很难加以区分,更无法在活细胞内进行特异、原位的研究。通过使用化学合成的片段体外重组核小体可以对定点的组蛋白修饰开展结构和功能研究,但在活细胞内进行定点修饰研究仍然受限。普林斯顿大学的Tom Muir教授开发的intein技术虽然可以通过多肽/蛋白质的胞外递送在一定程度上实现活细胞内的研究,但是具有较多的局限性。遗传密码子拓展技术能够将这些带有修饰的氨基酸以“非天然氨基酸”的形式“编码”到活细胞的组蛋白当中,能够实现修饰类型和氨基酸位点的“精准编程”,为表观遗传修饰研究提供了广阔的天地。陈鹏团队发现修饰的氨基酸可以被“编码表达”到组蛋白的特定位点,而在染色质整体水平上这些“精准编码”的组蛋白能够维持稳定并在生理条件下被有效地整合进染色体当中。基于此,大量的组学数据也展示出染色体上这些结构相近的化学修饰的特异性。这一技术对未来针对特定修饰功能或两到多种修饰之间协同功能研究提供了一个普适平台。

    2. 实现了“单个位点-特定修饰”的染色质相互作用蛋白质组-基因组“串联解析”

    陈鹏与合作者发现组蛋白在单个氨基酸位点上的修饰变化就足以引发三维基因组的变化,为位点特异的组蛋白修饰调控高阶3D染色质结构和功能提供了有力的证据,也预示了这个技术的巨大前景。通过将SiTomics技术与ChIP-MS、ChIP-seq联用,他们以染色体上特定位点的化学修饰为单元,进行了蛋白质组、基因组的多层次“关联研究”,通过光交联同时可以在活体细胞里鉴定各种结合蛋白质,这些在以往的传统研究中是难以实现的。作者选择围绕显著受代谢影响的H3K56进行了各种功能研究,发现H3K56bhb在增强子上的调控作用,也展示了该技术在生物研究上的应用。

    该工作有助于我们去理解受化学修饰调控的蛋白质组和基因组是如何相互影响,并最终影响基因转录的。我们希望这样的化学生物学工具越来越多,同时期待文中所提供的大量数据信息能够推动更为深入的生物学机制研究。

  • 原文来源:https://www.chem.pku.edu.cn/kyjz/147275.htm
相关报告
  • 《裴端卿组cell stem cell新发文,揭示细胞命运变化中的染色质开关规律》

    • 来源专题:再生医学与健康研发动态监测
    • 编译者:malili
    • 发布时间:2017-12-08
    • 中国科学院广州生物医药与健康研究院裴端卿课题组长期从事诱导多能性干细胞重编程过程中的分子机制研究,曾发表了大量重要的学术研究成果,然而对于细胞重编程过程中染色质重塑的动态调控变化并不是十分清楚。12月7日,该课题组在Cell Stem Cell上发表了题为“Chromatin Accessibility Dynamics During Reprogramming of iPSCs”的研究论文。科研人员发现在体细胞重编程进程中,细胞命运的改变伴随着大规模染色质结构重排这个过程可以用简单的二进制“开-关”来描述:首先关闭体细胞特异性位点,同时逐渐打开多能性相关位点;论文在染色质结构重排的进程中,还发现Sap30作为一个重编程过程激活的重要因子,会通过去乙酰化修饰来抑制体细胞关键转录因子对染色质的调控。 论文解读 染色质结构在细胞命运调控中起着非常重要的作用,然而其具体作用机制一直没有被清晰的阐述过。借助体细胞重编程这一模型,并基于研究团队前期开发的高效诱导体细胞重编程的培养系统—iCD1 【1】,并结合ATAC-seq技术【2】,深入研究了染色质动态变化与细胞命运转变之间的关系。 不得不说,最近这一两年,用少量细胞染色质开放区域定位技术(ATAC-seq)研究染色质的开放状态已经越来越广泛,以清华大学颉伟研究员为代表的一批中国学者利用该技术已取得多项重要的研究成果(颉伟组在《自然》长文报道哺乳动物着床前胚胎染色质动态调控图谱)。 通过ATAC-seq技术,研究人员分析了重编程过程中染色质开放区域动态变化的模式,发现在多能性获得和细胞命运转变过程中染色质结构具由从开放到关闭(open to close,OC)和关闭到开放(close to open,CO)这样简单的二元变化规律。同时他们还发现在体细胞重编程早期MEF细胞的很多特异性开放位点会被迅速关闭(OC),而到重编程后期很多多能性相关的位点则会被打开(CO)。 研究团队认为开关的事件是直接与转录因子活性相关,因此对CO/OC位点的基序(motif)进行分析,发现CO位点显著的富集出了重编程因子OCT、SOX、KLF的基序(motif),而OC位点则没有重编程因子OCT、SOX、KLF的富集,相反在OC位点上富集出了很强的MEF细胞特异性的转录因子例如AP-1,ETS,TEAD,RUNX等家族成员。上述结果表明在体细胞重编程过程中,体细胞相关染色质关闭(OC)过程是OCT、SOX、KLF非依赖的过程。 通过进一步筛选,他们发现表观修饰基因Sap30【3】在体细胞重编程早期被重编程因子OSK激活,并通过促进成纤维细胞关键基因启动子区去乙酰化修饰,而使其启动子区逐渐关闭,最终沉默成纤维细胞关键调控基因,推动重编程进程。 该研究结果首次揭示了体细胞重编程过程中染色质结构动态变化的规律—CO/OC逻辑,并阐述了体细胞特异性退出的机制,为理解体细胞重编和其他相关细胞命运转变提供了新的可参考的理论模型。 虽然该基本规律是在体细胞重编程过程中发现,其概念应用价值可能包含人体的发育过程,也包括一些病理过程,例如癌变过程多数伴随着胚胎样基因的非正常表达,从而使癌变细胞“忘记”自己的位置与功能。如果能发掘出正常细胞在向癌细胞转变早期的染色质变化特征,癌症也许可以得到及时的诊断和防治。而在发育层面上,阐明不同功能细胞发育过程的CO/OC逻辑,将极大地推进干细胞领域的发展,有助于在体外获得具备修复衰老损伤器官组织的功能细胞,实现更广泛的组织再生和器官再造。 据悉,该项研究由中国科学院广州生物医药与健康研究院裴端卿课题组领导完成,裴端卿、陈捷凯和Andrew Hutchins为本文的共同通讯作者,李东伟、刘晶和杨雪洁为论文的共同第一作者。
  • 《Nat Biotechnol:科学家成功利用CRISPR技术实现剂量依赖性的基因表达激活》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2019-11-15
    • 近日,一项刊登在国际杂志Nature Biotechnology上的研究报告中,来自北卡罗来纳大学Eshelman药学院等机构的科学家们通过研究开发了一种新方法,能够利用CRISPR基因编辑技术进行剂量依赖性的基因表达激活,文章中,研究人员描述了如何利用这种技术以一种可替换的方法来改变基因表达以及其工作的原理和机制。 此前研究结果表明,CRISPR/Cas9基因编辑技术能抑制或激活基因的表达,但截至目前为止,其并不能用来促进剂量依赖性的基因表达激活;这项研究中,研究人员就发现了一种新方法,其能利用化学表观遗传修饰物(CEMs,chemical epigenetic modifiers),通过使用部分内源性染色质-激活器来激活所需的基因进行表达,这或许就能消除外源性转录激活剂的必要性。 研究者发现的新方法包括两种组分,其中第一种就是Cas9,其能与结合蛋白FKBP一起催化失活;第二种就是利用FK506制造的CEM,其能与特殊的分子相关联,而这种分子则能与所需的细胞表观遗传机器相互作用;具体地说,这种新方法能够制造激活CEM的分子,而该分子能帮助寻找基因激活机器,包括CEM114、CEM87和CEM88,诸如此类分子能与不同的酶类相结合,上述两个组分能被用来以研究者需要的方式激活基因的表达。 随后研究人员检测了这种新型系统,即利用绿色荧光蛋白感染HEK293T细胞,随后对表达导向RNA和非活性Cas9的细胞进行计数,紧接着研究者利用质粒表达和上述三种CEMs中的一种来检测基因表达的激活状况,他们必须等待两天才能够确认,是否与未处理的细胞相比绿色荧光蛋白的表达量会发生增加,研究者还仔细分析了用CEMs处理过的失活Cas9,来确定是否CEM系统能以一种所需的方式激活绿色荧光蛋白,在该过程中,研究者发现,使用CEM87进行处理是唯一能够增加绿色荧光蛋白表达的方法。最后研究者表示,这种新型技术能够用来在验证性研究中分析剂量依赖性的基因表达激活状况。