2023年12月7日,斯坦福大学的研究人员在Cell上发表了题为SPLASH: A statistical, reference-free genomic algorithm unifies biological discovery的文章。
今天的基因组学工作流程通常需要与参考基因组对齐,这限制了发现。该研究引入了一个统一的范例,SPLASH (统计初级对齐不可知序列归位) ,它直接分析原始测序数据,使用统计检验来检测调控的特征: 样本特异性序列变异。
SPLASH 可以检测到多种类型的变化,并且可以高效地大规模运行。该研究显示 SPLASH 识别 SARS-CoV-2中的复杂突变模式,在单细胞水平上发现调节的 RNA 同种型,检测适应性免疫受体的巨大序列多样性,并揭示在参考基因组中未记录的非模式生物体中的生物学: 地理和季节性变化以及鳗草中的硅藻关联,受气候变化影响的海洋植物以及章鱼中的组织特异性转录物。SPLASH 是一种统一的基因组分析方法,可以在没有元数据或引用的情况下进行扩展性发现。