《纠错代码提高DNA存储准确性》

  • 来源专题:生物科技领域知识集成服务
  • 编译者: 陈方
  • 发布时间:2020-09-10
  • 2020年7月16日PNAS报道,一个跨学科研究小组开发了一种新方法,可以以前所未有的准确性和效率将DNA存储的信息翻译出来,为DNA存储技术在大数据时代更加广泛的应用提供重要技术保障。
    人类正在以前所未有的速度创造信息,这促使人们开发一种更加有效、大量和持久的存储信息的方式。DNA存储效率是传统存储方法的500万倍,DNA存储迅速成为一种耐久的高密度信息存储方式。然而,目前基于DNA的信息编码策略在DNA合成和测序过程中错误率都很高,需要将保存的信息片段重复10到15次,以确保信息正确保存和读取。
    此次研究者开发一种修复三种基本类型的DNA错误(插入,删除和替换)的HEDGES(Hash Encoded, Decoded by Greedy Exhaustive Search)纠错代码。HEDGES还可以纠正其他复合错误,结合标准Reed-Solomon外部代码进行更正。此外,HEDGES可以纳入一些用户定义的序列约束,例如避免重复过多,或者鸟嘌呤-胞嘧啶(GC)含量太高或太低。
    通过计算机模拟和合成DNA来测试代码,根据其性能,研究者开发了适用于更大数据集的统计模型,该模型可以从降解程度高达10%的DNA中正确无误地恢复PB级别和EB级别的数据。研究者表示,随着DNA合成和测序成本的不断降低,HEDGES将在大规模准确信息编码中找到更多应用。
    吴晓燕 编译自https://phys.org/news/2020-07-power-dna.html
    原文链接:https://www.pnas.org/content/pnas/early/2020/07/15/2004821117.full.pdf
                       原文标题:HEDGES error-correcting code for DNA storage corrects indels and allows sequence constraints

相关报告
  • 《青岛能源所研发出高耐久低成本的DNA合成纠错系统》

    • 来源专题:中国科学院文献情报先进能源知识资源中心 |领域情报网
    • 编译者:guokm
    • 发布时间:2020-03-13
    •  DNA的从头合成是合成生物技术的基础平台之一。但是,由于大规模DNA合成过程中难以避免地产生错误,DNA纠错环节的效率和经济性已经成为限制DNA合成质量、通量与成本的关键问题之一。针对此瓶颈,青岛能源所单细胞中心研发出高耐久低成本的DNA合成纠错系统,大幅度提高了DNA纠错环节的效率和经济性。该工作发表于ACS Synthetic Biology。   就像我们写字一样,DNA合成是一个容易出错的过程。寡核苷酸的化学合成、DNA聚合酶的延伸、基于寡核苷酸的基因片段组装等大片段DNA合成的每一步骤均可能引入错误碱基。这些“错误”如果没有及时“纠正”,它们将随着核酸链的复制而传播和扩散,导致DNA合成产物中一般只有5%-60%具有完全正确的序列。因此,DNA纠错环节的效率和经济性已经成为限制DNA合成质量、通量与成本的关键问题之一。   与其它的酶纠错系统相比,DNA错配修复蛋白(MutS)的纠错效率较高,而且使用相对简便。但在实际应用中,MutS酶活的持久性较差,在7天左右即开始显著下降,导致在一个完整的基因组合成流程中需要多次表达与纯化。这不仅阻碍了纠错环节的通量化和规模化,也限制了MutS纠错系统的工业化应用。   针对这一瓶颈问题,单细胞中心张佳博士带领的攻关小组,首先,提出了基于搭建人工二硫键来提高酶活持久性的思路,根据MutS的X射线晶体结构,理性设计了10组可能显著提高蛋白质稳定性的二硫键,并从实验中筛选出最佳的组合。其次,通过与麦芽糖结合蛋白 (MBP)的融合表达,来提高MutS蛋白的异源表达量。最后,通过储存条件的优化,将MutS蛋白与纤维素结合挂柱并保存在四摄氏度,进一步提高了MutS的使用寿命。最终构建的名为iMICC的DNA合成纠错系统,在保证纠错性能的前提下,能够保持峰值酶活长达63天,因此不再需要频繁地重复制备新鲜的MutS。同时,成品挂柱的储存方式还大大提高了使用的便捷性。   针对在溶液中合成Cas9同源基因和在芯片上合成木糖还原酶同源基因等的验证表明,iMICC能够将基因合成产物的错误率分别降低到0.64 / Kb和0.41 / Kb,组装成的正确片段占比72.1%和86.4%,而成本仅为$0.37/反应。因此,iMICC能够将基因合成过程中的碱基准确性提高37.6倍,同时大幅度提高了使用寿命。与常用的商品化纠错酶CorrectASE相比,iMICC的纠错性能高出6.6倍,却便宜了26.7倍。    因此,iMICC为建立一个更为简便、高效、稳定和低成本的工业化纠错流程奠定了基础。此外,这也是首次证明了二硫键的理性设计与搭建可以提高酶活的持久性,该思路为包括DNA纠错酶在内的诸多核酸工具酶的提质改性提供了有益启发。   单细胞中心张佳博士是该论文的第一作者。该工作由单细胞中心徐健研究员主持完成,得到了研究所姚礼山研究员团队、赵广研究员团队和联川生物技术公司高晓连教授、李璐璐博士等的帮助。该研究获得了国家自然科学青年基金、相关人才计划等项目的支持。(文/图 张佳)   论文   Zhang, J., Wang, Y. F., Chai, B. H., Wang, J. C., Li, L. L., Liu, M., Zhao, G., Yao, L. S., Gao, X. L., Yin, Y. F., and Xu, J*. (2020). Efficient and low-cost error removal in DNA synthesis by a high-durability MutS. ACS Synthetic Biology. 文章链接:https://pubs.acs.org/doi/10.1021/acssynbio.0c00079
  • 《“基因魔剪”准确性低于预期》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2018-07-19
    • 英国《自然·生物技术》杂志16日在线发表了一项重要研究:有“基因魔剪”之称的CRISPR-Cas9基因组编辑技术,在靶点附近引起的DNA删除或重排,比科学家此前预期得要严重。该发现意味着,研究人员必须密切观察基于CRISPR-Cas9疗法对编辑后细胞造成的序列变化。 目前,CRISPR-Cas9基因组编辑已被广泛认为是癌症、HIV、血友病和镰状细胞疾病的潜在治疗方法。Cas9的作用机制,是剪切基因组内靶点位置的细胞DNA双链。细胞修复DNA双链断裂的路径通常会引入小规模的DNA插入或删除。这个过程可以用来使致病基因失活,或修正基因突变。在此之前,人们对这一技术手段的主要安全顾虑是Cas9的脱靶率较高。 但此次,英国维康桑格研究所科学家艾兰·布拉德雷及其同事通过研究小鼠和人类的实验室细胞系发现,除了已知的伴随DNA双链断裂修复发生的小规模DNA错误,CRISPR-Cas9技术还可能在靶点附近导致大规模的DNA删除,在部分情况下,甚至引起复杂的DNA重排。 研究团队发现,在小鼠干细胞和人类视网膜色素上皮细胞内,可能出现规模达数千DNA碱基的删除,导致临近基因或调控序列可能受到影响,并改变细胞功能。 研究人员表示,以上发现与Cas9的临床应用的相关性尚未可知。虽然上述实验的原本目的不是检测除了敲除靶基因之外染色体变化的有害影响,但是却突出了一个潜在安全隐患,急需对此开展进一步的研究。 而就在今年2月,《自然》杂志网站还曾报道一项由斯坦福大学领导的研究,其揭示人体自身的免疫系统也可能会破坏基于CRISPR-Cas9开发的基因疗法。