《三种RNA测序技术怎么选?Nature子刊综述讲明白了!》

  • 来源专题:转基因生物新品种培育
  • 编译者: zhangyi8606
  • 发布时间:2020-10-11
  • 在过去的十年中,RNA测序(RNA-seq)成为差异基因表达、mRNA差异剪接等研究场景不可或缺的重要手段。随着高通量测序技术的不断发展,RNA-seq的研究技术、分析方法也在不断发展。现在RNA-seq用于研究RNA相关的各方面生物学问题,包括单细胞基因表达、RNA翻译、RNA结构、空间转录学、全转录组、RNA-蛋白互作等。早前 Nature Reviews Genetics 发表了一篇综述,全面介绍了RNA-seq的发展。

    转录本是非常多样和复杂的,绝大多数基因不符合“一基因一转录本”的模式,这些基因往往存在多种剪切形式。而基于短读长测序平台的转录组测序,首先把RNA打断成小片段进行测序,然后再通过生物信息的方法进行拼接。因此由于读长的限制,基于短读长测序平台的转录组在组装的过程中存在较多的嵌合体,并且不能准确地得到完整转录本的信息,从而对后面的表达量分析、可变剪接、基因融合等分析造成了较大的影响。因此,科研人员开发出不同的转录组测序技术,以期在不同的场景应用不同的技术来针对性地解决问题。

    综述中通过比较RNA的短读长测序、长读长测序和直接测序这三种技术发现:短读长测序适合做基因定量,研究基因差异表达;长读长(cDNA)测序适合于研究转录本结构信息,如异构体、可变剪切、基因融合等;RNA直接测序可以研究转录本结构信息和修饰信息,但是对RNA样本要求会更高。

    通过多项对比,文中指出,测序错误率高是长读长测序平台的一大劣势。PacBio测序平台错误类型属于随机错误,这种错误通常可以通过使用CCS(circular consensus sequence)增加测序深度来解决。在一个CCS读长中,cDNA和接头进行环化后,每个cDNA就可以被多次测序,这个cDNA在长读长序列中为subreads。这些subreads被组合后就可以产生一致的序列。分子测序的次数越多,最终的错误率就越低。CCS已经被证明可以将错误率降低到与短读长相当的水平,甚至更低。但是,更多的测序数据量读取了相同的分子,使得读取的唯一转录本变得更少,这又加剧了测序通量的问题。

    现在PacBio平台测序长度不断增长,但是如果采用上述的CCS模式测序全长转录组,无法实现数据量增长得到的insert reads也增长,检测的转录本数量同时增长的效果。基于此,我们开发了多倍通量全长转录组,相较于常规全长转录组测序,相同的数据,可以获得5倍的有效数据,转录本检测数量翻倍!

    多倍通量全长转录组在建库过程中将多条序列随机首尾相连,通过CCS测序,一条CCS read可得到多条转录本,充分利用PacBio平台的长读长并大幅提升Sequel测序全长reads的获得率。而且,多倍通量全长转录组包含了UMI技术,因此在享受高效数据利用的情况下还能进行基因的绝对定量。

    RNA直接测序可以获得poly(A)的全长序列,我们的poly(A)全长转录组在获得全长转录组信息的同时,仍可以获得poly(A)的长度信息,并进行poly(A)的长度相关的信息分析。

相关报告
  • 《Cell综述 | CRISPR基因组编辑技术的过去、现在和未来》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-03-13
    • 2024年2月29日,苏黎世大学的研究人员在 Cell 期刊发表了题为Past, present, and future of CRISPR genome editing technologies的综述论文。在这篇综述中,作者讨论了CRISPR基因编辑技术在研究和治疗方面的现状,强调了限制它们的局限性和近年来开发的技术创新来解决这些问题。此外,还检查和总结了基因编辑在人类健康和治疗方面的当前应用情况。最后概述了未来可能影响基因编辑技术及其应用的潜在发展。 基因组编辑,即对生物体遗传物质进行精确和有针对性的修改,是分子生物学领域最重大的进展之一。它具有深远的应用,从揭示基本的生物学过程到推动医学、农业和生物技术的发展。随着2023年底首次批准基于CRISPR疗法用于人类疾病治疗,CRISPR基因组编辑正在进入一个新时代。该综述旨在提供CRISPR基因组编辑全景视角,强调其当前状态、潜在的未来发展以及必须克服的障碍,以充分实现其在人类医学中的承诺。 CRISPR-Cas核酸酶的可编程性使其能够产生位点特异性的DNA双链断裂,从而使其能够快速适应基因组编辑技术。来自化脓链球菌的典型Cas9蛋白(SpCas9)是第一个被用于基因组编辑的Cas核酸酶,由于其固有的高活性和特异性,目前仍然是最广泛使用的基因编辑器。Cas12a是一种起源于V型CRISPR-Cas系统的Cas核酸酶,在Cas9之后几年被发现,同样被用于基因组编辑。与Cas9不同,Cas12a不需要tracerRNA进行激活,这一特点已被用于体内多重编辑。 CRISPR-Cas系统作为简单有效的可编程基因编辑工具的重新应用,极大地推进了许多基础和应用研究领域,为开发靶向基因治疗和各种生物技术应用奠定了基础。然而,高度进化的生物防御系统的功能特征与精确的基因组编辑工具的功能有所不同。因此,第一代基于CRISPR的基因编辑工具的应用潜力受到几个关键因素的限制,主要包括特异性、靶向范围,以及依赖内源性DSB修复机制来实现基因组编辑,此外,CRISPR组分的递送受到递送载体和目标细胞或生物体的特定限制。 自基于CRISPR的基因编辑首次展示以来,该领域已经得到了前所未有的发展。基于Cas9和Cas12a核酸酶的第一代DNA双链断裂依赖性基因组编辑器的功能已经通过不断创新得到增强,这些创新不仅增加了这些工具的多功能性,还提高了它们的精度并最小化了非预期编辑后果。然而,对于它们安全性的担忧仍然存在,这既是因为脱靶编辑活性,也由于靶向DNA双链断裂的潜在基因毒性效应。为了减少非预期编辑的发生,已经探索了多种方法来精确地控制CRISPR基因组编辑器。 CRISPR基因组编辑技术的发展带来了一系列具有显著潜力的应用,从基础研究的进步到新治疗方法的开发。首先,CRISPR已经改变了遗传学研究,使科学家能够在各种实验模型中模拟致病突变,创建大规模的全基因组筛查方法,并开发合成基因记录设备来研究正常发育和疾病进展。CRISPR系统还被被用于开发分子诊断,使病毒DNA或RNA的检测变得特异、快速和灵敏。其次,CRISPR技术还被用于建立消除病毒或细菌人类病原体的策略,后者是通过开发工程噬菌体实现的。限制病原体传播的一个具体例子是基于CRISPR的基因驱动,其中引入特定的抑制性特征(例如雌性不育),以摧毁携带病原体的昆虫种群(主要是传播疟疾等疾病的蚊子)。最后,过去十年的CRISPR基因组编辑已经发展出多种治疗遗传病的方法,其中一些已经从基于细胞和动物模型的临床前研究进入了人类临床试验。这包括体内和体外治疗纠正策略。体内治疗纠正方法涉及将基因编辑组件输送到人体内部受影响的组织。相比之下,体外方法涉及从患者身上收集细胞,在实验室中编辑它们,然后将编辑后的细胞移植回患者体内。此外,体外CRISPR编辑还使自体和异体基因组修饰的细胞疗法的产生成为可能,主要用于癌症免疫治疗。 随着当前CRISPR技术的局限性在过去十年中变得越来越明显,新的方法和方法学不断发展和优化,以解决这些限制并提高基于CRISPR的基因组编辑的效率和多样性。这些新兴的第三代工具和技术,包括最近发现的紧凑型RNA引导核酸酶类,这些核酸酶已被用于基于DNA双链断裂的编辑,并可作为其他基因组编辑器(例如碱基编辑和先导编辑)的RNA引导的DNA结合平台。 在基因组编辑领域,向宿主基因组中插入大片篇的DNA序列,特别是在缺乏同源定向修复(HDR)的非分裂细胞中,仍然是一个主要的未满足需求。在这种背景下,CRISPR引导的重组酶和转座子的开发提供了一种有前途的和潜在强大的途径来填补这一技术缺口。基于逆转录转座子的基因组编辑技术和编辑RNA转录本的新方法也已经出现。最后,新的基因组编辑工具的创建继续与递送方法的发展相伴而行,这对治疗应用构成了重大挑战。 总的来说,这些进步反映了快速发展的基因组编辑领域的动态,其中每种新方法都提供了互补的优势,以解决基因操作的各种需求和挑战。 此外,对于DNA双链断裂的基因毒性以及同源定向修复(HDR)低效率的担忧进一步推动了“第二代”CRISPR技术的发展,这些技术在不依赖于DNA双链断裂形成和HDR的情况下介导基因组编辑,其中最具代表性的是碱基编辑器(base editor,BE)和先导编辑器(prime editor,PE)。目前可用的CRISPR基因组编辑技术主要包括CRISPR-Cas9、CRISPR-Cas12a、碱基编辑、先导编辑、转录调控、RNA编辑,这为基因组编辑提供了更具针对性的方法,特定技术特别适合某些类型的编辑或递送模式。但虽然这些基因组编辑工具包的新增内容对解决与规范化CRISPR基因组编辑相关的许多限制做出了显著贡献,但它们在编辑活性、特异性和递送方面仍然存在一些限制。 过去十年,基因组编辑领域从一个新兴的科学追求转变为一种变革性的生物技术力量。第一代CRISPR技术主要基于内源性修复或位点特异性DNA双链断裂(DSB),已被第二代技术,例如碱基编辑和先导编辑所补充,这些技术可以在不产生DSB的情况下直接靶向DNA修饰,通常被认为更安全,并产生更可预测的编辑结果。新兴第三代CRISPR技术正在开发中,以解决该领域中两个主要未满足的需求:实现大片段DNA序列的精确插入,以及通过表观基因组工程实现在没有任何基因组编辑的情况下进行基因调控。这些和其他技术的持续进步是由两种方法实现的:一方面,通过挖掘宏基因组来发现新的分子系统,另一方面,通过合成生物学和人工智能支持的分子工程。 基因组编辑的现状最好地体现在不断扩展的新技术和方法的组合中,这些技术和方法主要基于源自CRISPR-Cas系统的RNA引导分子工具,彻底改变了我们精确和轻松地操纵遗传物质的能力。当前的发展趋势表明,这些技术将继续得到改进,在特异性、效率和传递机制方面逐步提高。值得进一步研究的领域将包括开发更具特异性和免疫原性的递送载体、减少脱靶效应以及增强对编辑结果的控制,从而提高基因组编辑的准确性和精度。展望未来,与纯粹基于蛋白质的技术相比,核酸引导系统可能仍然是基因组编辑的核心,因为它们具有简单的可编程性和适应性。然而,它们的应用模式可能会演变,可能会转向更瞬时性的编辑方法,以最小化意外长期基因变化的风险,或者通过瞬时递送来最小化基因组的破坏和免疫反应。 随着第一代CRISPR技术已经通过体外编辑被批准用于临床治疗镰状细胞病(SCD)和β-地中海贫血等疾病,以及体内基因编辑疗法的出现,限制未来广泛的基因组导向的治疗发展的瓶颈将不再是缺乏安全、高效或精确的基因组编辑器。主要挑战将在于递送方法,特别是对于血液和肝脏以外的器官以及某些体外细胞类型。体内递送方法的进步,例如mRNA疫苗开发中所见,可能会显著促进CRISPR技术的应用。此外,即使是目前可用的CRISPR方法编辑的组织和细胞,也需要更多的基础研究来确定安全的编辑靶点。因此,随着新传递载体的开发以及致病变异及其纠正策略的表征,可以通过CRISPR治疗的疾病范围将不断扩大。预计CRISPR领域外的进展将有助于推动这些技术向新的方向发展,增强其功能。在这种背景下,人工智能(AI)的兴起将使我们能够准确地模拟复杂的基因组编辑场景,预测靶向和非靶向编辑结果,并设计更强大的基因组编辑器,从而加快实施安全治疗方法的步伐。 伦理和社会影响,特别是涉及人类生殖细胞基因组修改的问题,将继续成为基因组编辑讨论的前沿。随着人类体细胞编辑成为现实,治疗性和非治疗性生殖细胞编辑的前景,以及对人类基因组进行可遗传改变的潜力,提出了深刻的伦理问题,全球社会必须加以解决。由于人类胚胎的研究表明,CRISPR基因组编辑技术在用于生殖目的的生殖细胞编辑方面不够安全或有效。此外,生殖细胞编辑的治疗效用有限,可能只对少数人有益。然而,对于基因组编辑技术的治理和负责任的管理,国际共识的紧迫性不能被夸大,特别是考虑到其快速发展、不断改进和广泛采用。 总的来说,尽管存在这样那样的挑战,但CRISPR基因编辑的未来是光明的。它不仅有潜力推动研究突破和革命人类医学,还有潜力提高农业生产和应对气候生态挑战,从而为子孙后代建立一个更健康、更可持续的未来。
  • 《研究综述:2019年12月6日》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2019-12-10
    • 欢迎来到2019年12月6日的研究综述,这是布罗德研究所的科学家和他们的合作者发表的最新研究的一个重复快照。 寻找增强剂 虽然我们体内的每个细胞都含有相同的基因序列,但增强子控制着基因在不同细胞类型中的表达方式,例如,确保肝细胞不会失控并开始启动肾脏基因。然而,确定和预测哪些增强子调节哪些基因的能力仍然难以捉摸。查理·富尔科、约瑟夫·纳赛尔、杰西·恩格雷茨、研究所所长兼创始主任埃里克·兰德以及来自布罗德和其他地方的同事在《自然·遗传学》杂志上描述了一种可以确定哪些增强子调节哪些基因的实验技术,以及一种预测基因组中增强子-基因连接的模型。由于先前的研究已经将增强子突变与疾病联系起来,这些新工具将对了解人类健康非常重要。 细菌测试进入噬菌体- r阶段 一种快速诊断细菌感染的方法可以帮助病人更快地康复,并防止耐药微生物的传播。每年有3.5万美国人死于耐药微生物。Roby Bhattacharyya是传染病和微生物组项目(IDMP)的核心成员,他和同事们开发了一种新的诊断方法,称为GoPhAST-R,它结合了基因型和表型测试来确定细菌的抗生素敏感性。GoPhAST-R寻找抗生素诱导的基因表达的模式,并识别关键的耐药基因以区分易感和耐药菌株。在《自然医学》杂志上,该方法可以在不到4小时内提供94%到99%的准确率,相比之下,使用标准的临床实验室方法需要28到40小时。 当质量不够大的时候 关于转录因子(TFs)如何与基因启动子一起控制基因表达、细胞表型和细胞状态的规则仍然模糊不清,部分原因是规模问题。在《自然生物技术》,卡尔•德波尔核心研究所细胞天文台特拉维夫Regev董事成员和卡拉曼和他的同事发布了巨大平行记者化验(GPRA):机器学习方法,合并与实验室系统,衡量TFs与超过1亿randomly-synthesized基因启动子序列在酵母基因表达的影响。GPRA揭示了tf -启动子结合的关键特征,并为研究基因变异如何影响基因表达和疾病风险提供了一个创建复杂、全面模型的机会。 将数据和谐地结合在一起 为了充分利用现有的单细胞rna测序(scRNA-seq)研究,研究人员需要能够收集来自各种组织、数据源、测序平台等的数据。Ilya Korsunsky,医学和人口遗传学(MPG)项目的研究所成员Soumya Raychaudhuri,和他的同事开发了Harmony,一种允许科学家整合来自多个数据集的scRNAseq数据的算法。在Nature方法中,他们展示了Harmony的能力:1)处理大型数据集;2)在集成数据中识别宽粒度和细粒度的细胞群;3)处理复杂实验中生成的数据;4)处理来自多个实验平台的数据。Harmony的R包可以在GitHub上找到。 心的读者 潜在的朊病毒疾病治疗的目的是降低大脑中的朊病毒蛋白(PrP),但目前测量脑脊液(CSF)中PrP的方法没有捕获蛋白质片段或不同的构象。Eric Vallabh Minikel、Eric Kuhn、Sonia Vallabh、研究所科学家和蛋白质组学平台主任Steven Carr及其同事开发了一种基于多重反应监测的质谱仪方法,可以精确测量人类和其他模型物种的PrP肽浓度。根据分子和细胞蛋白质组学的报道,他们发现CSF PrP随着疾病的进展而减少,所以降低PrP药物的剂量研究应该集中在有症状的高危个体上。请阅读美国生物化学和分子生物学学会发布的新闻稿。 绘制癌症中免疫细胞的多样性 调节性T细胞(treg)可削弱抗肿瘤免疫反应,因此与几种癌症的不良预后有关。为了更好地了解treg在肿瘤发展中的作用,研究人员利用单细胞RNA测序技术,在基因工程小鼠肺腺癌模型中绘制了肿瘤发展过程中这些细胞的多样性。在《细胞报告》中,由Amy Li、Rebecca Herbst、David Canner、Aviv Regev、癌症项目高级副成员Tyler Jacks及其同事领导的研究小组提供了肿瘤微环境中Tregs多样性的高分辨率视图,从而突出了治疗干预的潜在途径。 肾脏器官会竖起大拇指 从患者诱导多能干细胞(iPS)中培养的人肾脏类器官是一种很有前途的新工具,用于开发急需的精确治疗。学习如何复制这些瀑样跨“诱导多能性”细胞,Ayshwarya萨勃拉曼尼亚,Eriene-Heidi Sidhom, Maheswarareddy Emani,协会成员和肾病倡议主任安娜Greka,和他的同事们分析了约450000个细胞肾瀑样来自四个iPS细胞系,相比他们单细胞概要文件从成人和胎儿肾脏。研究小组发现,类器官的组成和发育是人类肾脏组织的可靠替代物,将类器官移植到小鼠体内可以进一步提高类器官的质量。在自然交流中学习更多。 神经系统炎症的治疗靶点 关于鞘脂代谢在调节中枢神经系统炎症和多发性硬化等疾病中的作用,人们知之甚少。Julian Avila-Pacheco、副成员Francisco Quintana、研究所科学家和代谢组学平台高级主任Clary Clish及其同事通过结合蛋白组学、代谢组学、转录组学和体内遗传微扰研究,发现了鞘脂类代谢对星形胶质细胞的影响。他们的发现发表在《细胞》杂志上,定义了一种驱动促炎性星形细胞活动的新机制,概述了线粒体抗病毒信号蛋白在中枢神经系统炎症中的新作用,并确定了鞘脂类代谢是治疗中枢神经系统炎症的一个有希望的靶点。 疟原虫将如何抵抗这种药物? 恶性疟原虫对临床使用的每一种疟疾药物都产生了迅速的耐药性。在药物开发的早期就发现这种寄生虫的分子逃逸路线,可以帮助研究人员找到更好的药物。为了解决这个问题,IDMP研究所的成员Dyann Wirth和她的团队设计了一种预测疟原虫抗性机制的方法,他们在《科学转化医学》上描述了这种方法。研究人员在体外和受感染的小鼠体内都将这种寄生虫暴露在能够阻断疟疾病毒的二氢旋转脱氢酶(DHODH)的化合物中。然后,他们选择耐药生物并对其基因组进行排序。研究小组发现,在体外和小鼠体内,耐药寄生虫也出现了类似的快速耐药性和共同突变。研究人员得出结论,选择体外耐药性可以预测体内耐药性,并认为这种方法可用于潜在新药的筛选。 解密蛋白质串扰,一次一个细胞 蛋白质参与功能途径并形成一系列复杂的相互作用来驱动细胞的行为。理解这种“相互作用组”对于理解驱动生物学的机制至关重要。尽管科学家们创造了一个有价值的“参考相互作用组”,将这些相互作用概括为一个单一的资源,但这种工具无法提供特定于不同细胞类型的信息。 Shahin Mohammadi,Jose Davila-Velderrain和Epigenomics Program准成员Manolis Kellis在Cell Systems中描述了一种计算框架(SCINET),该框架可以单细胞分辨率分析此相互作用基因组。使用scRNA-seq,SCINET可以在单个细胞中重建相互作用基因组,从而使研究人员能够识别在各种条件下受干扰的单细胞相互作用。 与ALS相关的新基因 肌萎缩性侧索硬化症(ALS)是一种迟发性神经退行性疾病,众所周知,遗传因素是造成这一疾病的危险因素。为了发现与ALS相关的新基因,由Sali Farhan和研究所成员Benjamin Neale领导的一个小组在MPG中分析了3864名患者和7839名健康个体的外显子组,这是迄今为止最大的ALS外显子组病例对照研究。研究小组观察到ALS病例中罕见的蛋白质截短遗传变异,以及与已知ALS基因和新基因DNAJC7的关联。可通过ALS知识门户网站获得ALS遗传数据的摘要统计信息。查看《自然神经科学》中的完整故事。 自闭症和多动症之间的遗传相似性 自闭症谱系障碍(ASD)和注意力缺陷多动障碍(ADHD)具有重要的遗传成分,但是要收集大量的人群进行遗传分析一直是这两者的挑战。由Kyle Satterstrom,研究所成员,MPG联合主任Mark Daly和丹麦iPSYCH研究计划的同事组成的团队,利用已归档血斑的DNA分析了大约8,000名患有ASD和/或ADHD的儿童的外显子组以及5,000个对照,以更好地了解这些疾病的遗传结构。研究人员发现,ASD和ADHD在限制基因中截短变异的负担相似,并确定MAP1A基因中截短变异与患病风险有关。从《自然神经科学》和iPSYCH的新闻稿中了解更多信息。