《Nature Genetics:一种鉴定同源长非编码RNA的新方法》

  • 来源专题:生物育种
  • 编译者: 季雪婧
  • 发布时间:2024-01-24
  •     长非编码RNA(lncRNA)的发现和表征是过去几十年分子生物学领域的重大进展。已有研究成果表明,lncRNA在发育、肿瘤等多种生理和疾病过程中发挥调控作用1-3,但目前绝大多数lncRNA 的功能仍然未知。通过鉴定不同物种间同源的lncRNA,可以筛选出在进化过程中保守的lncRNA,这些lncRNA也更可能具备重要的功能。但是,由于lncRNA的序列保守性较低4,5,传统的序列比对方式只能鉴定出极少的不同物种间同源的lncRNA。例如,在斑马鱼和人类上万的lncRNA基因中,通过序列比对只能找到几十个序列保守的同源lncRNA。因此,不管是从lncRNA的理论还是技术方面考虑,目前都亟需一种新的方法来鉴定不同物种之间的同源lncRNA。

        2024年1月9日,清华大学张强锋、北京大学汪阳明、席建忠研究团队合作在《自然×遗传》(Nature genetics)杂志上发表题为“计算预测和实验验证鉴定人类和斑马鱼之间功能保守的长非编码RNA”(Computational prediction and experimental validation identify functionally conserved lncRNAs from zebrafish to human)的研究论文。该工作开发了一套新的计算流程,在包括人类、小鼠、斑马鱼在内的8种脊椎动物中,鉴定保守的同源lncRNA,工作同时开发了基于CRISPR的基因敲除和回补筛选系统,通过实验验证了所鉴定的同源lncRNA在不同物种中的保守功能,为该领域的研究提供了新的思路。

        该团队开发了一套鉴定不同物种之间同源lncRNA的计算方法(lncHOME)。lncHOME计算方法通过比较基因组和机器学习的人工智能方法,在8种脊椎动物中鉴定出了一类在不同物种中具有保守基因组位置及保守RNA结合蛋白(RBP)结合位点模式的lncRNA(图1)。这些不同物种中潜在同源的lncRNA被命名为coPARSE-lncRNA (lncRNA with conserved genomic locations and patterns of RNA binding protein (RBP) binding sites)。

  • 原文来源:https://www.ebiotrade.com/newsf/2024-1/20240117064256679.htm
相关报告
  • 《Nature Genetics:破译长非编码RNA暗码》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2018-09-19
    • 到目前为止,科学家们还没有合适的方法来鉴定人类细胞中数万种不同lncRNAs的功能和角色,而今天我们描述的几百个lncRNAs好比巨大冰山的一角。 北卡罗莱纳大学的科学家们在《Nature Genetics》发文,报道了一种隐藏的密码,这种密码将lncRNAs的分子组成与其实际作用联系起来,并为其他研究人员开发了一种算法,根据潜在功能对lncRNAs进行快速分类。 索取 Milo 循环肿瘤细胞(CTC)蛋白质表达分析系统详细操作样本领 取 “长非编码RNA是基因组‘暗物质’的组成部分,我们开发这个工具的目的是帮助更好地理解它们在健康和疾病中的工作原理,”文章通讯作者药理学助理教授Mauro Calabrese博士说。 动植物的遗传信息储存在DNA中,细胞通过将DNA转录成紧密相关的分子(即RNA)来使用遗传信息。许多RNA被继续翻译成蛋白质,近几十年来,科学家们不得不思考这样一个事实:只有不到2%的基因组是如此使用的。大部分DNA被转录为不编码蛋白质的RNA,这些RNA被称为非编码RNA,长度超过200个核苷酸的被归类为长非编码RNA(lncRNAs)。 它们中的许多与蛋白或其他分子结合以打开或关闭基因,从而调节细胞进程。其中,最有名的是Xist,对女性正常发育有很重要的作用。另一种名为MALAT,关系到更具侵袭性和转移性的癌症。总的来说,生物学家确信,许多lncRNAs都具有重要的调节功能,受损可能会有助于疾病。然而,迄今为止,人们只表征了哺乳动物细胞中数千种不同lncRNAs中一小部分的功能。 挑战来自你无法透过它们的核苷酸组装序列来预测它们的功能,通常,具有相似功能的lncRNAs似乎具有非常不同的序列。 Calabrese和他的研究小组,包括第一作者Jessime Kirk和文理学院的数学和应用物理学教授Peter Mucha博士等人,试图破译lncRNAs序列和功能之间的黑暗密码。 他们从两个关键线索开始:首先,有证据表明,lncRNAs主要通过与蛋白质结合起作用;第二,RNAs利用短序列将其全部结构与蛋白质相连通。 “我们推断,在lncRNAs中,相比其他位点,蛋白质结合序列更为重要,”Calabrese说。“这一观点最终被证明是正确的。” 研究小组开发了一种基于计算机的方法(名为SEEKR)来发现和比较lncRNAs中被他们称为“k-mer”的蛋白结合序列,但是并不理会k-mer在整条lncRNAs中的精确定位。 研究小组发现,基于人类和小鼠lncRNAs的k-mer含量是相似的,大约一半的人类和小鼠lncRNAs可以被分类为五个不同群体。基于k-mer的分类方法还可预测lncRNAs在细胞中的常见位置,以及它们通常与哪种蛋白质相结合。 令人惊讶的是,研究小组发现,根据k-mer 含量划分的群体在物种间高度相似。人类和小鼠的lncRNAs群体彼此类似,许多哺乳动物lncRNAs群体即使在远亲动物中也有明显的对应物。一种哺乳动物lncRNA群体作为一类名为HOTTIP的lncRNA代表,在其他脊椎动物中,甚至海胆中也存在表亲lncRNA群体。 “就k-mer含量来说,人类lncRNAs子集可能类似于进化上更遥远的物种,而不是其他人类lncRNAs,”Calabrese说。“这支持了一个观点,即尽管缺乏明确的线性序列相似性,lncRNAs在不同生物体内具有相似的功能。” 最后,研究人员利用完全人工合成的lncRNAs(含有Xist的k-mer),并且分子整体序列不同于任何已知的lncRNAs,再将其置于SEEKR算法,并进行简单的体外试管测试,都表明这种人工lncRNAs的预期功能具有Xist样活性。 现在他们希望利用基于k-mer的方法来指导癌症lncRNAs研究,还期望改进这种方法更好地从序列信息预测lncRNAs功能。 “我们的基因组产生了如此多的lncRNAs,现在我们可以通过观察这些分子的序列来预测哪些分子在我们的细胞中起重要作用,”Calabrese说。
  • 《又一新方法:揭示RNA如何调节基因活性》

    • 来源专题:转基因生物新品种培育
    • 编译者:zhangyi8606
    • 发布时间:2020-06-19
    • 哺乳动物基因组编码大量的长非编码RNA——lncRNA,大多数非编码转录本定位于细胞核,并且已证明其中一些在调节基因表达和染色质重塑中发挥作用。但多数非编码RNA的功能和作用区域仍有待研究。为了研究这类RNA的功能,研究人员已经开发出多种定位转录本与基因组相互作用位点的方法。 来自俄罗斯科学院生物技术研究中心和莫斯科物理技术学院的生物信息学家,新近开发出一种称为RADICL-seq的方法,可绘制完整细胞核中全基因组范围的RNA-染色质相互作用图谱。这种方法基于临近位置的交联连接,与现有方法相比可以减少对新生转录本的偏向性、同时提高基因组覆盖率和独特的绘图效率,可识别不同类别的转录本“占据”基因组的特有模式,以及识别细胞类型特异的RNA-染色质相互作用,并揭示转录在染色质结构形成中的作用。 RNA和基因调控 尽管同一机体所有细胞都共享相同的基因组DNA,但每种类型的细胞中活性表达的基因集合各有不同——从而产生不同水平的蛋白质组合,表现出不同的细胞特征和功能——比如脑细胞不同于血细胞,尽管它们共享相同的DNA。如今科学家普遍认为,RNA是决定哪些基因表达或活跃的因素之一。 大多数长非编码RNA与染色质相互作用。染色质具有改变其构象或“形状”的能力,从而可以“隐蔽”或者“暴露”出某些基因以便进行转录。长非编码RNA可通过与某些染色质区域相互作用,促成这种构象变化,由此影响基因活性变化。要了解非编码RNA对基因组调节和结构维持具有哪些调节潜力,首先是要知道某个的RNA与哪个染色质区域相互作用。 现在有多种技术能够定位lncRNAs与基因组相互作用,但是有的需要使用反义RNA探针而通常不适用于denovo从头发现的lncRNA,或者不适合在多种细胞类型中的高通量应用;还有的技术能够评估全基因组RNA与染色质相互作用但是需要大量input细胞。有的需要使用Dpn II消化染色质、由于Dpn II在整个基因组中的位点数量有限而使得其对捕获的RNA与DNA相互作用的覆盖范围有限。 发表在《自然通讯》上的这项技术称为RADICL-seq(RNA And DNA-Interacting Complexes Ligated and sequenced ),将RNA和DNA相互作用复合物进行连接并测序——它可以在RNA与基因组靶标区域相互作用时捕获RNA,并对捕获的每个RNA进行全面定位。 RADICL-seq方法的主要步骤如下:借助1%甲醛处理细胞使之交联固定,然后分离细胞核,通过用DNAseI酶部分消化基因组DNA;再用RNase H处理来消化核糖体RNA以提高结果的准确性;用桥接适配子(bridge adapter)将相邻的DNA和RNA连接起来,去交联化后,将RNA-DNA嵌合体转化为双链DNA,再进行测序。 解码非编码RNA 与其他现有方法相比,RADICL-seq的优点在于 1.具有更高的分辨率——用DNase I对染色质进行非序列依赖性消化代替限制酶,使得切割位点更为均匀而克服此类分辨率限制; 2.更高的准确性——顺磁性羧化微珠方便彻底清洗多余的DNA碎片和适配子以降低噪音并可有效减少对起始输入材料量的需求,RNase H消化RNA-DNA杂交产物可减少RADICL-seq捕获的新生RNA-染色质相互作用的比例,从而提高其他类型相互作用的捕获率。 3.使用Eco P15I产生大小一致的RNA和DNA读取片段大大改善了与基因组的比对。 RADICL-seq实现了更高的检测能力,因此具有更好的性/价比。 卓越分辨率使研究人员不仅可以检测染色质与非编码RNA的相互作用,还可以检测出染色质与编码蛋白质基因的内含子RNA序列的相互作用。研究表明,多数长非编码RNA顺式结合临近的基因组靶标(短距或中等距离)。令人惊奇的是,编码蛋白质的基因转录本中被剪切掉的内含子在这种RNA与染色质的顺式相互作用中占相当部分。这种结合看来是稳定的,研究人员观察到有内含子RNA介导的相互作用可抑制转录延伸达数小时之久。因为已有被剪切下来的内含子对酵母生长表型具有生物学作用的报道,作者认为在高等真核生物钟也可能存在类似的机制——特定的内含子RNA躲过降解并与染色质顺式相互作用,调控临近基因的转录。 该技术还可以用于研究细胞类型特异性的RNA染色质相互作用。研究人员在小鼠实验中发现,染色质与两种不同细胞(即胚胎干细胞和少突胶质祖细胞)中的RNA之间的相互作用模式与这些细胞类型中的优势基因表达相关。 新方法所具有的灵活性意味着科学家可以通过修改实验来收集更多的生物学信息。特别是该技术可以鉴定出不是由染色质蛋白介导的直接RNA-DNA相互作用。来自生物技术研究中心和MIPT的生物信息学家进行的分析表明,不仅DNA和RNA之间的标准双螺旋相互作用,而且涉及RNA-DNA三链体的相互作用都可以参与基因调控。同样,这种相互作用突出了非编码RNA在靶向特定基因位点的蛋白质中的重要性。 “我们计划进一步研究RNA在调节基因表达,染色质重塑以及最终在细胞身份方面的作用。希望我们能够在不久的将来通过使用这些非编码RNA来调节基因。这对治疗疾病特别有帮助。” Yulia Medvedeva说是RAS生物技术研究中心的调控转录组学和表观基因组学组负责人,并领导了MIPT细胞技术生物信息学实验室。她还管理着由俄罗斯科学基金会(该研究共同资助)资助的资助项目。