自2003年人类基因组计划完成之后,测序技术发展迅猛。2005年,首款二代测序仪诞生,自此,测序技术的发展势如破竹、高歌猛进!测序读长不断加长,从当初的几十个碱基长度到几百碱基,除此之外,测序通量不断提升、时间不断缩短,测序成本急剧下降,伴随而来的是群体测序时代,以及精准医学时代的开启。
在测序技术发展初期,百家争鸣、百花齐放,各种新技术陆续诞生。对于二代测序而言,主要有两类测序方法,即连接法测序和合成法测序。
连接法测序,英文简称SBL测序,利用1-2个已知碱基标记的探针与目标DNA序列杂交,然后再与下一个标记的探针连接,检测标记探针的信号,从而知道目标DNA的序列信息。SOLiD测序技术便是连接法测序的代表。
合成法测序,英文简称SBS测序,是一种依赖DNA聚合酶来测序的方法;该方法又可以分为循环可逆终止法(cyclic reversible termination,CRT)和单碱基添加(single-nucleotide addition,SNA)法。其中, Illumina测序仪采用的是CRT方法, Roche/454等测序仪采用的是SNA方法。
对于SNA方法,其依赖单个信号来标记每个测序的碱基。因为不能终止反应,所以每次只能允许进一种碱基以防止继续延长,否则如果遇到单碱基重复也会继续读取,增加错误率。
对于CRT方法,拿Illumina测序技术来说,四种dNTP被不同的荧光基团标记,每个循环可结合一个互补的碱基,通过四次拍照和比对,便可以推测出与模板莲所结合的碱基。由于加入的dNTP 3’端羟基进行了封闭性化学修饰,所以每轮反应结束之后,荧光基团需要被切除,以便进行下一个反应。
对于以上这些方法来说,短板也很明显,由于对化学反应本身的错误没有有效的检查和矫正机制,导致了其准确性往往被限制在聚合酶的保真度、信号与序列的线性度、信号检测的灵敏度这几个因素上。2017年11月6日,Nature Biotechnology期刊发表了一篇重磅论文,介绍了由北京大学黄岩谊教授团队开发的一项被称为ECC( Error-Correction Code)测序的新的测序技术,该技术是基于信息理论来修正错误的高准确度荧光DNA测序方法,将使高通量测序仪的精准度进一步大幅提升。通过实验室样机的测试,测序读长可以达到250bp,其中前200个碱基的准确率100%!