《美国开发基于机器学习的土壤污染物检测新方法》

  • 编译者: 张毅
  • 发布时间:2025-06-20
  • 5月9日,美国莱斯大学和贝勒医学院合作开发了一种用于识别土壤中的有害污染物的新策略。该方法使用一种称为表面增强拉曼光谱的光成像技术,跟踪分子发出的独特图案或光谱,并使用特征纳米壳来增强光谱中的相关特征。研究人员利用密度泛函理论,即预测原子和电子在分子中的行为的计算建模技术,根据化合物的分子结构计算了整个范围内多环芳烃及其衍生物的光谱,为多环芳烃及其衍生物生成一个虚拟的“指纹”库。采用特征峰提取和特征峰相似度两种互补的机器学习算法对真实土壤样品中的相关光谱特征进行解析,并将其与虚拟光谱库中绘制的化合物进行匹配,从而实现土壤中的有毒化合物检测。
相关报告
  • 《美国莱斯大学利用机器学习识别土壤有害污染物》

    • 编译者:张毅
    • 发布时间:2025-06-20
    • 5月9日,莱斯大学跨学科团队提出一种基于光成像、化合物光特征理论预测与机器学习算法的创新方法,可检测土壤中的多环芳烃(PAH)及其衍生化合物(PAC)等有毒化合物。该方法使用表面增强拉曼光谱的光成像技术,利用定制纳米壳放大分子与光的相互作用,捕获污染物的独特“化学指纹”光谱;基于密度泛函理论计算污染物的分子结构与理论光谱,建立虚拟光谱数据库;开发“特征峰提取”和“特征峰相似性”互补机器学习算法,解析样本光谱并与理论库精准匹配,可识别实验数据缺失的污染物,甚至因环境转化而发生结构改变的化合物。其效率远超传统实验室检测。
  • 《植物所开发出基因组组装质量评估和改进新方法》

    • 来源专题:生物育种
    • 编译者:季雪婧
    •     近年来,随着测序技术和算法的开发,大量动植物基因组被陆续测序和组装,但基因组组装质量参差不齐,存在不同程度的组装错误,影响后续的相关研究。高质量的参考基因组对于基因的精准注释和功能研究以及比较基因组学和调控元件的挖掘等至关重要。目前已有一些基因组组装质量评估的方法,而多数方法仅提供概述性的评估值,未能针对特定区域设置特定碱基给出精准度的评估。中国科学院植物研究所焦远年研究组研究开发了新的不依赖参考基因组的组装质量评估工具CRAQ (Clipping information for Revealing Assembly Quality),可以在单碱基水平检测和评估基因组序列的精准度,并提供了相关纠错方案。CRAQ通过将原始测序序列比对到组装的基因组上,基于序列比对产生的有效剪切对齐(clipping alignment)信息,精准地检测基因组中存在的组装错误。结合SMS长读长测序片段和NGS短读长测序片段与基因组比对的特征,CRAQ可以识别基因组内小规模的区域组装错误(CREs)和大范围的结构组装错误(CSEs)。不同类别的错误数量经过统计和标准化处理后被转化为两个组装质量评估指标——R-AQI和S-AQI,以反映不同层面的基因组组装质量。此外,CRAQ能够将组装错误与基因组内的高杂合区域或单倍型差异区分开来,并在单碱基分辨率下指示低质量组装区域和潜在错误断点的位置。因此,CRAQ能够帮助研究人员识别基因组中存在的嵌合片段,并将这些片段准确地拆分,以利于结合光学图谱或构象捕获(Hi-C)技术进一步构建结构更加准确的参考基因组。10月17日,相关研究成果发表在《自然-通讯》(Nature Communications)上。研究工作得到国家重点研发计划、国家自然科学基金和中国科学院青年交叉团队项目等的支持。