《中国科学院北京生科院环形RNA数据挖掘新技术研究获进展》

  • 来源专题:转基因生物新品种培育
  • 编译者: 王晶静
  • 发布时间:2021-03-29
  • 2021年3月12日,中国科学院北京生命科学研究院研究员赵方庆团队在Nature Biotechnology上发表了题为Comprehensive profiling of circular RNAs with nanopore sequencing and CIRI-long的论文,研究内容为高效测定环形RNA全长转录本的实验和计算方法。该研究主要是利用随机引物对环形RNA进行的滚环反转录扩增,而后应用纳米孔测序技术对环形RNA的全长序列进行直接测序,并使用开发的CIRI-long算法识别长测序读段中的环形RNA序列并进行全长重构。实验结果表明,与传统的环形RNA二代测序技术相比,该方法将环形RNA检测灵敏度提升了20倍,并可实现对不同长度(<100bp-5kb)的环形RNA全长序列的无偏识别,大幅提升了环形转录本的重构能力,为其功能研究提供了重要的实验方法和计算工具。

    环形RNA是一类在真核生物中广泛存在的具有特殊环状结构的RNA分子。研究表明,在生物体内,环形RNA主要通过其序列特征,发挥miRNA海绵、RBP海绵及翻译短肽等重要的生物学功能。因而环形RNA的全长序列确定是进行环形RNA功能研究的重要基础。由于环形RNA的内部序列与线性mRNA分子高度相似,在数据中很难区分来自环形RNA和线性RNA分子的读段。研究方法对于环形RNA结构的识别能力主要被二代测序的读长所限制,对于长度较长(>500bp)的环形RNA分子,仍缺少有效的全长重构手段。

    针对这一问题,研究团队构建并优化环形RNA建库流程,使用随机引物对环形RNA进行滚环反转录扩增,结合片段长度筛选(~1kb),针对长度更长的目标cDNA片段进行富集,最后使用纳米孔测序技术,实现了对目标环形RNA的全长序列进行直接测定。同时,研究人员进一步开发了CIRI-long算法,识别纳米孔测序数据中的环形RNA结构,并使用偏序比对算法,校正纳米孔测序带来的测序错误。随后,CIRI-long基于基因注释和剪接信号信息,提供单一样本内和多样本间结果的整合与校正方法,实现了环形RNA的准确识别和全长重构。为了评估CIRI-long方法的准确性和效率,研究人员利用模拟数据和多次实验重复,综合评估CIRI-long结果,发现该方法具有较高的灵敏度,且与实验结果保持了高度的一致性。同时,结合二代测序结果及公共数据库的全面分析,表明CIRI-long可有效地对高表达环形RNA进行识别,且与二代测序方法相比,CIRI-long对环形RNA的检测效率有着近20倍的提升,对表达丰度较低的环形RNA有着更好的识别效果,同时可以识别到长度更长的环形RNA分子,大幅提升了环形RNA全长的检测能力。利用该方法,研究进一步发现了一类由内含子自连形成的新型环形RNA分子(Intronic self-ligated circRNA)。这类环形RNA具有特殊的剪接位点内侧的GT-AG信号和较高的两侧序列保守性,在之前工作中缺乏普遍研究。此外,研究人员在小鼠不同组织中,对内含子自连型环形RNA的表达模式开展了进一步探究,发现Tpm1基因可以产生一个长度为767bp的内含子自连型环形RNA——circTpm1。与Tpm1基因的其他内含子相比,该分子成环区域具有相对较高的保守性,且与线性mRNA在组织间具有不同的表达模式,说明circTpm1并非其母本基因转录的副产物,可能具有一定的生物学功能。综上,研究人员开发了基于纳米孔测序技术的环形RNA全长识别流程CIRI-long,通过结合滚环反转录扩增和纳米孔长读长测序技术,可直接测定环形RNA的全长序列,实现了对环形RNA的高灵敏度检测和内部结构重构。与传统的二代测序方法相比,CIRI-long大幅提升了环形RNA全长重构能力,并可实现与二代测序相近的分析成本。同时,CIRI-long提供了样本间整合分析的工具,并针对纳米孔测序的高错误率建立了有效校正方法,为环形RNA的功能研究提供了重要的方法学工具,具有很高的应用价值。

    该研究工作由赵方庆团队完成,获得国家相关人才计划、国家重点研发计划及中国科学院的支持。赵方庆团队在前期的工作中建立了环形RNA识别、可变剪接检测及定量等方法,相关研究发表在Nature Biotechnology(2021)、Nature Communications(2016,2020)、Genome Biology(2015,2020)、Briefings in Bioinformatics(2018)、Trends in Genetics(2018)、Genome Medicine(2019)、Cell Reports(2019)和Bioinformatics(2020)上。这些研究成果丰富了我们对环形RNA的组成及结构的认识,为深入了解这一类特殊的RNA分子提供了重要工具和数据支持。

    论文链接:https://www.nature.com/articles/s41587-021-00842-6

相关报告
  • 《北京生科院发表环形 RNA 研究综述》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:huangcui
    • 发布时间:2018-01-18
    • 近日,中国科学院北京生命科学研究院计算基因组学实验室研究员赵方庆的研究综述文章,以 Computational strategies for exploring circular RNAs 为题,在线发表在 Trends in Genetics 上。该论文全面阐述了环形 RNA 研究和数据挖掘中诸多方法,探讨了相关方法在非编码 RNA 数据挖掘中的适用条件与优劣评估,并指出未来环形 RNA 数据挖掘的发展趋势与挑战。 环形 RNA 是近年来获得广泛关注的一类结构呈闭合环形的 RNA 分子,并入选 Clarivate Analytics 2017 年度热点前沿领域。环形 RNA 的基因来源、内部组成、细胞定位、生成机制与生物功能均较为多样,通过高通量测序数据的挖掘对其深入研究成为该领域的必经途径。依据参考基因组的使用策略,现有的识别算法可划分为基于分段比对(split-alignment based)和基于伪参考序列构建(pseudo-reference based)两类。由于所借助比对算法类型的不同,各识别算法又分别针对剪切型(splice-aware)和全能型(versatile)比对算法进行优化。此外,在向后剪接读段(back-spliced junction read)的检测和配对末端比对信息的筛选上,这些识别算法采用的策略也不尽相同。以上关键步骤影响识别算法在不同转录组测序数据上的表现,目前现有的十余种环形 RNA 识别算法在敏感度、可靠性和适用范围上均有显著差别。 研究工作获得了国家自然科学基金委重大研究计划项目、相关人才计划项目和中国科学院的资助。
  • 《中国科学院海洋研究所在遥感大数据驱动的内波传播预报方面获新进展》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:liguiju
    • 发布时间:2021-03-22
    • 海洋内孤立波(简称内波)在海洋内部生成、传播和耗散,在全球海洋中分布广泛。目前已观测到的内波振幅最大可达240米,对海上作业平台、海洋生态、声呐探测等具有重要影响。内波的生成和传播随机性较强,其预报研究一直是难点问题。 近日,中国科学院海洋环流与波动重点实验室、海洋大科学中心李晓峰团队在利用海洋遥感大数据和机器学习开展内波预报方面取得重要进展。基于多年、多源内波遥感观测数据,利用机器学习算法挖掘内波遥感大数据信息,实现了基于数据驱动的苏禄-苏拉威西海内波的传播预报,预报模型结果与遥感观测结果吻合较好。 该研究构建的内波预报模型与传统理论模型和经验模型相比,不需要内波生成源、振幅等先验知识,并且精度更高。该研究基于机器学习开发的内波预报模型鲁棒性较强,模型中引入的误差不会导致预报结果产生较大偏移。 海洋遥感领域旗舰期刊IEEE Transactions on Geoscience and Remote Sensing(JCR Q1 top期刊,IF=5.855)以期刊封面形式发表报道了该项研究成果。该工作得到了中国科学院战略性先导科技专项、国家自然科学基金委项目等资助。 该研究相关成果及链接如下: Xudong Zhang and Xiaofeng Li*, Combination of Satellite Observations and Machine Learning Method for Internal Wave Forecast in the Sulu and Celebes Seas, IEEE Transactions on Geoscience and Remote Sensing, 59(4), 1-11, 2020. doi:10.1109/TGRS.2020.3008067. https://ieeexplore.ieee.org/document/9142440