《上海有机所开发出四维代谢组学精准分析技术Met4DX》

  • 来源专题:生物育种
  • 编译者: 姜丽华
  • 发布时间:2023-04-21
  •  中国科学院上海有机化学研究所生物与化学交叉研究中心研究员朱正江课题组在《自然-通讯》(Nature Communications)上,在线发表了题为A mass spectrum-oriented computational method for ion mobility-resolved untargeted metabolomics的研究论文。该工作针对基于离子淌度质谱的四维代谢组学技术开发了一种端到端的精准数据分析技术Met4DX,用于四维代谢组学数据的四维峰检测、峰对齐和峰定量,并结合四维数据库实现代谢物的四维精准匹配和鉴定(图1)。

      离子淌度质谱相较于传统质谱增加了根据离子尺寸、形状以及电荷分离的离子淌度,有效提升了质谱的分离能力,特别是代谢物同分异构体的分辨能力,其跟液相色谱联用形成多维分离分析技术,可进一步提高复杂生物样本分析的分离度和峰容量。一次四维代谢组学分析能够同时对代谢物离子进行四个维度的表征,包括精确质量数(MS1)、二级质谱图(MS/MS)、色谱保留时间(RT)和离子淌度碰撞截面积(CCS),能有效提升对复杂生物样品中代谢物定性和定量分析的覆盖度和准确度。然而,四维代谢组数据的高度复杂性对数据的高效精准分析提出了挑战,尤其是四维质谱峰的检测仍是难点。因此,四维代谢组数据分析技术和工具相对有限。目前,少量工具如MS-DIAL与MZmine等均采用自上而下压缩数据的降维策略进行峰检测。该降维策略可以降低数据的维数和复杂性,但降维过程也不可避免低引入了信号掩蔽及干扰,显著降低了四维峰检测的灵敏度。

      液相色谱-离子淌度-质谱依次从液相、离子淌度以及质谱维度对代谢物实现多维分离,所需要的时间也逐级减小。受到该分离方式的启发,本研究开发了从一张质谱图出发的自下而上峰组装算法(mass spectrum oriented bottom-up assembly algorithm)用于四维代谢组学数据中四维峰的检测(图2)。该技术的特点是将每一张质谱图作为四维数据中的最小数据单元,采用逆向工程的策略依次构建其在离子淌度和液相色谱上的峰形。具体地,对于每一张质谱图,该算法会依次进行其前体离子的搜索、离子淌度流出峰的组装与检测、离子淌度流出峰的拓展、色谱流出峰的组装与检测和四维峰积分等五个步骤实现四维代谢峰检测与峰定量。本工作开发的自下而上的峰组装算法避免了数据压缩与降维,有效地提高了四维峰检测的覆盖度与灵敏度。以上述算法为核心,科研人员进一步开发了适用于四维代谢组学的端到端的精准数据分析技术Met4DX,通过二级谱图去冗余模块、自下而上的峰组装模块、四维峰对齐以及分组模块、代谢物的多维匹配与鉴定模块等实现了的四维复杂代谢组的精准定性和精确定量分析。

      Met4DX技术能够实现高覆盖的四维质谱峰检测,定量精密度高。与同类技术相比(如MS-DIAL和MetaboScape),Met4DX能够提升四维峰检测的覆盖度2-3倍,提升准确定量代谢物的数目2-5倍。Met4DX在代谢物同分异构体识别上具有优异的性能。以在小鼠肝脏代谢组为例,Met4DX精准识别代谢物同分异构体数目高达3033对,比同类技术显著提升3.6倍,且可准确识别出CCS差异为1%的共流出同分异构体。同时,该研究还收集了HMDB和KEGG中的超过13万个代谢物,建立了目前最全面的四维代谢物数据库用于代谢物的多维匹配与鉴定。

      目前,Met4DX支持包括布鲁克timsTOF和安捷伦DTIM-MS等仪器平台采集的四维代谢组学数据。为了方便相关领域研究应用该工具,课题组提供了docker供学术界用户免费使用Met4DX(https://hub.docker.com/r/zhulab/met)。该工作开发的四维代谢组学精准分析技术M4dx-ret4DX已申请国家发明专利和国家软件著作权。研究工作得到国家自然科学基金、科技部、中国科学院和上海市科学技术委员会等的支持。

  • 原文来源:https://www.cas.cn/syky/202304/t20230413_4883944.shtml
相关报告
  • 《上海有机所发展出多层代谢网络技术》

    • 来源专题:转基因生物新品种培育
    • 编译者:姜丽华
    • 发布时间:2022-12-07
    •   中国科学院上海有机化学研究所生物与化学交叉研究中心研究员朱正江课题组在《自然-通讯》(Nature Communications)上,在线发表了题为Metabolite Annotation from Knowns to Unknowns through Knowledge-guided Multi-layer Metabolic Networking的研究论文。该工作发展出知识驱动的多层代谢网络技术(Knowledge-guided multi-layer networking,KGMN),在复杂生物样本中实现了未知代谢物的大规模鉴定。    生命体代谢组包含内源性产生的已知代谢物,以及微生物菌群、植物、食物和其他来源的未知代谢物。这些未知代谢物对生命活动具有重要的调控作用。然而,如何大规模鉴定未知代谢物是当前代谢组学研究的热点和难点。前期研究中,朱正江课题组发展了基于代谢反应网络的代谢组学技术MetDNA(Nature Communications, 2019, 10: 1516)。该技术利用代谢反应网络中产物和底物存在结构相似性与二级质谱图相似性的基本原理,设计了代谢物二级质谱图“谱图借用”、“多次迭代”算法,利用标准谱图库鉴定出的代谢物作为种子,依靠代谢反应网络进行代谢物注释的迭代和传递,突破了标准二级质谱图库的覆盖度限制,实现大规模的已知代谢物鉴定。然而,该技术仍存在一些局限:代谢物鉴定传递的过程仅限于已知代谢反应网络,因而无法用于发现新的未知代谢物;复杂质谱数据中的大量冗余信号(如同位素峰、加合物峰、中性丢失和源内裂解等)会对代谢物的鉴定造成假阳性。    研究进一步发展了知识驱动的多层代谢网络技术(KGMN),实现了从已知代谢物鉴定未知代谢物的能力,并显著提升了代谢物鉴定的准确度。基于该技术,科研人员开发出第二代MetDNA软件(MetDNA2)。该技术首次整合了3层代谢网络(图1)——知识驱动的代谢反应网络、知识引导的二级质谱图相似性网络、全局代谢峰相关性网络。研究利用理论代谢反应对已知的代谢反应网络进行扩展,从而构建了包含已知和未知代谢物的扩展代谢反应网络(KMRN,网络1)。MetDNA2从标准谱图库鉴定出的种子代谢物出发,基于扩展代谢反应网络和“谱图借用”策略,构建二级质谱图相似性网络(网络2)。该策略可通过多次迭代和循环扩增的算法,将代谢组学质谱数据中所有已知和未知代谢物连接,直至没有新的注释代谢物。在网络2中,代谢物节点之间的连接有四个限制条件——MS1 m/z、保留时间、MS/MS谱图相似性和代谢反应转化(metabolic biotransformation)。对于注释的每一个代谢物,MetDNA2会进一步通过靶向检索其相关的冗余质谱特征峰(如同位素峰、加合物峰、中性丢失和源内裂解等),并构建全局代谢峰相关性网络(网络3)。利用全局代谢峰相关性网络,MetDNA2对注释的代谢物结果进行全局优化,提升代谢物鉴定的准确度,去除假阳性注释结果返回最终鉴定结果。整个数据处理流程全程自动化,无需人工干预,提升了数据分析的效率。         利用上述技术,MetDNA2对已知代谢物的鉴定准确性从~70%提升至>95%。同时,在不同的生物样本中,MetDNA2还可鉴定~100-300个未知代谢物。MetDNA2对单个生物样本鉴定的代谢物数目在2000-5000个左右。在MetDNA2中,每一个鉴定结果均根据国际代谢组学协会标准指定特定的可信度。此外,MetDNA2还包含一系列重要的更新和升级,如全面升级的标准代谢物谱图数据库(>2000个代谢物);两种不同色谱体系的保留时间数据库(HILIC和C18体系);适配所有厂商的高分辨二级质谱数据等。    为了相关研究便捷的应用这一工具,课题组提供了用户友好型的界面和网站MetDNA2(http://metdna.zhulab.cn/),学术用户可免费注册使用。该工作开发的KGMN技术已申请国家发明专利和国家软件著作权。相关技术和软件的商业用途需要联系朱正江进行授权使用。研究工作得到国家自然科学基金、科技部、中国科学院、上海市科学技术委员会等的支持。
  • 《中国科学院动物所开发出快速精准的核酸检测技术》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2019-07-08
    • 高效精准的核酸检测技术在传染病原检测、食品安全检疫和致病基因筛查等许多方面具有重要的应用。基于CRISPR的基因组编辑技术极大地革新了生物医学研究。有趣的是,除了能够通过对基因组精准操控来进行功能基因组学研究,最近一些研究发现CRISPR系统的某些效应蛋白,例如Cas12a,在切割靶DNA后会受激获得切割非靶向单链DNA(ssDNA)的活性,从而能够用于快速简便地进行核酸检测,在传统的PCR和测序技术之外建立了一种新的核酸检测技术。 CRISPR-Cas12b/C2c1系统大多来自嗜热菌,由于其嗜高温的特性研究相对较少。中国科学院动物研究所李伟团队在2018年首次成功地改造Cas12b系统用于哺乳动物基因组编辑,建立了Cas9和Cas12a之后的第三个CRISPR基因编辑工具。在此基础上,研究团队发现Cas12b蛋白在激活之后同样具有任意切割ssDNA的特性,并开发出 CDetection(Cas12b-mediated DNA detection)检测系统,可以用于微量DNA的简便快速检测。CDetection是集Cas12b蛋白、向导RNA、ssDNA荧光报告分子和 RPA(recombinase polymerase amplification)等温扩增于一体的DNA快速检测系统。Cas12b蛋白在靶向切割RPA扩增目标DNA后激活ssDNA切割活性,任意切割ssDNA荧光报告分子,从而发出荧光信号(如图)。基于团队前期研究发现的Cas12b能够适应较广温度(25~60℃)和pH(1~8)的稳定性,CDetection系统相较Cas12a-DETECTR系统具有更高的灵敏度,可以实现亚aM(10-19 M)的灵敏DNA检测;同时,通过tgRNA(tuned gRNA)的引入,CDetection可以实现单碱基的区分。利用CDetection系统,能够快速地实现细胞、血液、尿液以及动植物中的细菌和病毒感染、基因分型以及SNP突变检测(如图)。 相关成果于7月2日在国际学术期刊Genome Biology 发表。该研究工作由动物所和中国科学院干细胞与再生医学创新研究院完成。动物所研究员李伟和周琪为论文的通讯作者;博士生滕飞、郭璐为共同第一作者。该研究受到中国科学院战略科技先导专项及科技部、基金委等的资助。