《又一新方法:揭示RNA如何调节基因活性》

  • 来源专题:转基因生物新品种培育
  • 编译者: zhangyi8606
  • 发布时间:2020-06-19
  • 哺乳动物基因组编码大量的长非编码RNA——lncRNA,大多数非编码转录本定位于细胞核,并且已证明其中一些在调节基因表达和染色质重塑中发挥作用。但多数非编码RNA的功能和作用区域仍有待研究。为了研究这类RNA的功能,研究人员已经开发出多种定位转录本与基因组相互作用位点的方法。

    来自俄罗斯科学院生物技术研究中心和莫斯科物理技术学院的生物信息学家,新近开发出一种称为RADICL-seq的方法,可绘制完整细胞核中全基因组范围的RNA-染色质相互作用图谱。这种方法基于临近位置的交联连接,与现有方法相比可以减少对新生转录本的偏向性、同时提高基因组覆盖率和独特的绘图效率,可识别不同类别的转录本“占据”基因组的特有模式,以及识别细胞类型特异的RNA-染色质相互作用,并揭示转录在染色质结构形成中的作用。

    RNA和基因调控

    尽管同一机体所有细胞都共享相同的基因组DNA,但每种类型的细胞中活性表达的基因集合各有不同——从而产生不同水平的蛋白质组合,表现出不同的细胞特征和功能——比如脑细胞不同于血细胞,尽管它们共享相同的DNA。如今科学家普遍认为,RNA是决定哪些基因表达或活跃的因素之一。

    大多数长非编码RNA与染色质相互作用。染色质具有改变其构象或“形状”的能力,从而可以“隐蔽”或者“暴露”出某些基因以便进行转录。长非编码RNA可通过与某些染色质区域相互作用,促成这种构象变化,由此影响基因活性变化。要了解非编码RNA对基因组调节和结构维持具有哪些调节潜力,首先是要知道某个的RNA与哪个染色质区域相互作用。

    现在有多种技术能够定位lncRNAs与基因组相互作用,但是有的需要使用反义RNA探针而通常不适用于denovo从头发现的lncRNA,或者不适合在多种细胞类型中的高通量应用;还有的技术能够评估全基因组RNA与染色质相互作用但是需要大量input细胞。有的需要使用Dpn II消化染色质、由于Dpn II在整个基因组中的位点数量有限而使得其对捕获的RNA与DNA相互作用的覆盖范围有限。

    发表在《自然通讯》上的这项技术称为RADICL-seq(RNA And DNA-Interacting Complexes Ligated and sequenced ),将RNA和DNA相互作用复合物进行连接并测序——它可以在RNA与基因组靶标区域相互作用时捕获RNA,并对捕获的每个RNA进行全面定位。

    RADICL-seq方法的主要步骤如下:借助1%甲醛处理细胞使之交联固定,然后分离细胞核,通过用DNAseI酶部分消化基因组DNA;再用RNase H处理来消化核糖体RNA以提高结果的准确性;用桥接适配子(bridge adapter)将相邻的DNA和RNA连接起来,去交联化后,将RNA-DNA嵌合体转化为双链DNA,再进行测序。

    解码非编码RNA

    与其他现有方法相比,RADICL-seq的优点在于

    1.具有更高的分辨率——用DNase I对染色质进行非序列依赖性消化代替限制酶,使得切割位点更为均匀而克服此类分辨率限制;

    2.更高的准确性——顺磁性羧化微珠方便彻底清洗多余的DNA碎片和适配子以降低噪音并可有效减少对起始输入材料量的需求,RNase H消化RNA-DNA杂交产物可减少RADICL-seq捕获的新生RNA-染色质相互作用的比例,从而提高其他类型相互作用的捕获率。

    3.使用Eco P15I产生大小一致的RNA和DNA读取片段大大改善了与基因组的比对。

    RADICL-seq实现了更高的检测能力,因此具有更好的性/价比。

    卓越分辨率使研究人员不仅可以检测染色质与非编码RNA的相互作用,还可以检测出染色质与编码蛋白质基因的内含子RNA序列的相互作用。研究表明,多数长非编码RNA顺式结合临近的基因组靶标(短距或中等距离)。令人惊奇的是,编码蛋白质的基因转录本中被剪切掉的内含子在这种RNA与染色质的顺式相互作用中占相当部分。这种结合看来是稳定的,研究人员观察到有内含子RNA介导的相互作用可抑制转录延伸达数小时之久。因为已有被剪切下来的内含子对酵母生长表型具有生物学作用的报道,作者认为在高等真核生物钟也可能存在类似的机制——特定的内含子RNA躲过降解并与染色质顺式相互作用,调控临近基因的转录。

    该技术还可以用于研究细胞类型特异性的RNA染色质相互作用。研究人员在小鼠实验中发现,染色质与两种不同细胞(即胚胎干细胞和少突胶质祖细胞)中的RNA之间的相互作用模式与这些细胞类型中的优势基因表达相关。

    新方法所具有的灵活性意味着科学家可以通过修改实验来收集更多的生物学信息。特别是该技术可以鉴定出不是由染色质蛋白介导的直接RNA-DNA相互作用。来自生物技术研究中心和MIPT的生物信息学家进行的分析表明,不仅DNA和RNA之间的标准双螺旋相互作用,而且涉及RNA-DNA三链体的相互作用都可以参与基因调控。同样,这种相互作用突出了非编码RNA在靶向特定基因位点的蛋白质中的重要性。

    “我们计划进一步研究RNA在调节基因表达,染色质重塑以及最终在细胞身份方面的作用。希望我们能够在不久的将来通过使用这些非编码RNA来调节基因。这对治疗疾病特别有帮助。” Yulia Medvedeva说是RAS生物技术研究中心的调控转录组学和表观基因组学组负责人,并领导了MIPT细胞技术生物信息学实验室。她还管理着由俄罗斯科学基金会(该研究共同资助)资助的资助项目。

相关报告
  • 《Cell论文解读!新研究揭示CRISPR/Cas9除了作为基因编辑工具,还可作为调节开关调节基因活性》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2021-01-23
    • 在一系列针对实验室培养的细菌开展的实验中,来自美国约翰霍普金斯大学的研究人员发现了证据,表明广泛使用的基因切割系统CRISPR-Cas9还有另一种作用---作为CRISPR-Cas9基因的自我调节开关。它调低或调弱CRISPR-Cas9活性的作用,可能会帮助科学家们开发出用于研究目的的细胞基因工程新方法。相关研究结果于2021年1月8日在线发表在Cell期刊上,论文标题为“A natural single-guide RNA repurposes Cas9 to autoregulate CRISPR-Cas expression”。 CRISPR-Cas9于1987年首次在肠道细菌的基因组中被发现,它是一组天然存在但不寻常的基因,具有切割其他类型细胞中DNA序列的潜力,这种能力在25年后才得以实现。它在基因工程中的价值---在包括人体细胞在内的活细胞中诱导可编程的基因变化---迅速得到了人们的认可。它作为基因组“编辑器”在全球数千个实验室中得到广泛应用。 CRISPR是规律间隔性成簇短回文重复序列的简称。Cas9,指的是CRISPR相关蛋白9,是进行DNA切割的酶的名字。论文通讯作者、约翰霍普金斯大学医学院分子生物学与遗传学助理教授Joshua Modell博士说,细菌天然地使用CRISPR-Cas9来切割病毒或其他潜在有害的DNA并使这种威胁失效。Modell说,就这种作用而言,“CRISPR不仅是一种免疫系统,而且还是一种适应性免疫系统---它可以通过保留病毒的一小段DNA来记住以前遇到过的威胁,这类似于罪犯的面部照片。”这些面部照片随后被复制到“向导RNA(gRNA)”中,告诉Cas9切割什么。 科学家们长期以来一直致力于解开CRISPR-Cas9作用机制的精确步骤,以及它在细菌中的活性如何被调高或调低。这些研究人员在寻找激活或抑制酿脓链球菌CRISPR-Cas9基因切割系统的基因时,发现了这一系统如何运作的线索。 具体来说,这些研究人员在CRISPR-Cas9系统中发现了一个基因,当失活后,它会导致这种基因编辑系统在细菌中的活性急剧增加。这个基因的产物似乎是对Cas9进行重新编程,使其作为刹车(brake)起作用,而不是“剪刀”,以调低CRISPR系统的活性。 论文共同第一作者、Modell实验室研究生Rachael Workman说,“从免疫的角度来看,细菌需要提升CRISPR-Cas9的活性,以识别和摆脱细胞经历的威胁,但它们也需要将调低这种系统的活性,以避免自身免疫---当免疫系统错误地攻击细菌本身的成分时,这种情形就会发生。” 为了进一步确定这种“刹车”的特殊性,Modell及其研究团队的下一步是更好地了解失活基因(tracrRNA)的产物。RNA是由DNA转录而来,对执行DNA制造蛋白的“指令”至关重要。TracrRNA属于一个独特的不制造蛋白的RNA家族。相反,它们作为一种支架,使Cas9酶能够携带含有罪犯面部照片的gRNA,并在入侵的病毒中切割匹配的DNA序列。 TracrRNA有两种大小:长和短。大多数现代基因切割工具CRISPR-Cas9都使用短的tracrRNA形式。然而,Modell团队发现,这种失活的基因产物是长形式的tracrRNA,其功能一直完全未知。 长形式的tracrRNA和短形式的tracrRNA在结构上相似,共同点是能够与Cas9结合。短形式的tracrRNA也能与gRNA结合。然而,长形式的tracrRNA不需要与gRNA结合,这是因为它包含一个模拟gRNA的片段。Modell说,“本质上,长形式的tracrRNA结合了短形式的tracrRNA和gRNA的功能。” 此外,这些研究人员还发现,gRNA通常会寻找病毒DNA序列,而长形式的tracrRNA靶向CRISPR-Cas9系统本身。长形式的tracrRNA倾向于停靠在DNA上,而不是切割它。当这种情况发生在一个基因的特定区域时,它就会阻止该基因的表达,或者说阻止该基因成为功能性的基因。 为了证实这一点,这些研究人员通过基因工程手段改变了长形式的tracrRNA中某一区域的长度,使得tracrRNA看起来更像gRNA。他们发现,在改变了长形式的tracrRNA后,Cas9再次表现得更像一把剪刀。 其他实验表明,在实验室生长的细菌中,如果有大量的长形式tracrRNA,所有CRISPR相关基因的水平都非常低。但当从细菌中去除长形式tracrRNA时,CRISPR-Cas9基因的表达量却增加了百倍。 将缺乏长形式tracrRNA的细菌细胞在实验室中培养3天,并与含有长形式tracrRNA的类似培养细胞进行比较。实验结束时,没有长形式tracrRNA的细菌已经完全死亡,这说明长形式tracrRNA通常可以保护细胞免受CRISPR-Cas9活性非常高时发生的病变和死亡。 Workman说,“我们开始有这样的想法,即长形式tracrRNA抑制但并没有消除它自身的CRISPR相关活性。” 为了观察长形式的tracrRNA是否可以被重新编程以抑制其他细菌基因,这些研究人员改变了长形式tracrRNA的间隔序列区,让它停靠在一个产生绿色荧光的基因上。与含有正常的长形式tracrRNA的细菌相比,具有这种突变版本的长形式tracrRNA的细菌发出的绿色荧光更少,这表明长形式tracrRNA可以通过基因工程来调低其他的细菌基因。 另一个来自埃默里大学的研究团队已发现,在寄生的新凶手弗朗西丝菌(Francisella novicida)中,Cas9可作为CRISPR-Cas9区域外基因的调节开关起作用。在这项新的研究中,虽然CRISPR-Cas9系统作为一种基因切割工具被科学家们更广泛地使用,但是Modell团队的研究结果提供了证据表明这种调节开关除了控制CRISPR-Cas9系统外,还控制了其他基因。 这些研究人员还在约40%的链球菌属细菌中发现了长形式tracrRNA的遗传成分。Workman说,对不具备长形式tracrRNA的细菌菌株的进一步研究,将有可能揭示它们的CRISPR-Cas9系统是否完好无损,以及这些细菌可能调节CRISPR-Cas9系统的其他方式。 Modell说,这些实验所发现的调节能力,为设计新的或更好的CRISPR-Cas9工具提供了机会,以便调节基因活性。他说,“在基因编辑方案中,科学家们除了使用长形式的tracrRNA来抑制基因活性外,还可能希望切割特定的基因。”
  • 《Nature:新方法成功构建基因活性三维图谱》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2019-12-18
    • 一种三维计算机模型(或者说算法)使得科学家们能够快速地确定哪些基因在哪些细胞中有活性,以及它们在器官中的精确位置。在一项新的研究中,德国亥姆霍兹协会马克斯-德尔布吕克分子医学中心的Nikolaus Rajewsky教授、以色列希伯来大学的Nir Friedman教授及其团队近期在Nature期刊上发表了这种新的方法以及从中获得的新见解,论文标题为“Gene expression cartography”。 Rajewsky教授是一位有远见的人:他想要确切地理解在疾病进展期间人体细胞中到底发生了什么,旨在能够识别和处理最初出现的细胞变化。Rajewsky教授解释道,“这不仅要求我们破译单个细胞中的基因组活性,而且还要在器官中对它进行空间跟踪。”比如,为了准确地诊断疾病并选择最佳疗法,癌症中免疫细胞的空间排列(“微环境”)极为重要。“总的来说,我们缺乏一种在分子水平上捕捉和了解组织的(病理)生理学特性的系统方法。” 针对不同组织类型的图谱 通过Rajewsky教授、Friedman教授、哈佛大学的Mor Nitzan博士和“基因调控元件系统生物学”项目负责人Nikos Karaiskos博士之间的合作,这些研究人员成功地使用一种特殊的算法为非常不同的组织类型---哺乳动物中的肝脏和肠上皮,以及果蝇和斑马鱼的胚胎,小脑的某些部分和肾脏---中的单个细胞构建出基因表达空间图。Rajewsky教授说,“有时纯粹的理论科学足以在高级科学期刊上发表---我认为这种情况在未来会更加频繁地发生。我们需要在机器学习和人工智能上加入投入。” Karaiskos解释道,“利用这些计算机生成的图谱,我们如今能够精确地追踪特定基因是否在组织某部分的细胞中有活性。如果没有我们开发的这种三维计算机模型,这一点是不可能实现的。我们将这种模型命名为novoSpaRc。” 空间信息在以前的研究中丢失了 直到最近几年,人们才能够大规模地高精度地确定器官或组织中的单个细胞在任何给定时间从它的基因组中获得的信息。这要归功于新的测序方法,比如多重RNA测序,它可以同时分析大量RNA分子。当基因变得活跃并表达蛋白时,RNA就在细胞中产生。Rajewsky早就意识到了单细胞测序的潜力,并在他的实验室中建立了它。 Rajewsky解释说:“但是,要让这项技术起作用,必须首先将待研究的组织分解为单个细胞。”这个过程导致有价值的信息丢失:比如,在解码特定细胞的基因活性时,它在组织中的原始位置就丢失了。因此,Rajewsky和Friedmann正在寻找一种使用单细胞测序数据来开发数学模型的方法,该数学模型可以计算整个基因组(甚至在复杂组织中)基因表达的空间模式。 Rajewsky和在柏林医学系统生物研究所开展研究工作的Robert Zinzen博士领导的团队在两年前已经取得了第一个突破。在Science期刊上,他们获得了果蝇胚胎的虚拟模型(Science, 2017, doi:10.1126/science.aan3235)。它以前所未有的空间分辨率显示了哪些基因在哪些细胞中有活性。这种基因定位是在84个标记基因的帮助下实现的:原位实验确定了这些基因在某个时间点上在卵形胚胎中的位置。这些研究人员证实他们的模型可以在活的果蝇胚胎中开展进一步的复杂原位实验。 由成千上万个拼图块和颜色组成的拼图 Karaiskos说:“不过,在这种模型中,我们逐个地重建了每个细胞的位置。这是可行的,这是因为我们只需要处理数量较少的细胞和基因。这一次,我们想知道的是,在几乎没有或没有任何以前的信息的情形下,我们是否可以重建复杂的组织。我们能够了解有关基因表达在复杂组织中是如何控制和调节的原理吗?”这种算法的基本假设是,当细胞相邻时,它们的基因活性或多或少相似。他们从相邻细胞的基因组中获得的信息要比相距较远的细胞中的更多。 为了验证这一假设,这些研究人员使用了现有的数据。对肝脏、肾脏和肠上皮而言,不存在更多的信息。他们只能够通过使用重建的组织样本来收集少量的标记基因。在一种情形下,只有两个标记基因可用。 Karaiskos在试图描述他在对这种模型进行计算的过程中面临的困难任务时,解释道,“这就像把一个巨大的拼图放在一起,上面有大量不同的颜色,可能有10000多种。如果正确地拼出了这个拼图,那么所有的颜色就会形成一个特定的形状或图案。”每个拼图块代表待研究组织中的一个细胞,每一个颜色代表一个可通过RNA分子读取的活性基因。 无论采用何种测序技术,该方法均有效 Karaiskos说:“我们如今有了一种方法,它使得我们不论使用哪种测序方法都能够在计算机中基于从单细胞测序获得的数据构建待研究组织的虚拟模型。关于单个细胞空间位置的现有信息可以输入到这种模型中,从而进一步完善它。”然后,借助于novoSpaRc,就有可能确定每个已知基因在组织中的哪些位置是有活性的,并经表达产生蛋白。 如今,Karaiskos和他的同事们也致力于使用这种模型追溯甚至预测组织或整个有机体中的某些发育过程。但是,Karaiskos承认可能存在某些与novoSpaRc算法不兼容的特定组织。他表示,这可能是一个值得期待的挑战:一个尝试解决新难题的机会!