为解决 GWAS 受种群结构和样本量限制的问题,研究人员开展水稻重要农艺性状基因挖掘的大规模 GWAS 荟萃分析研究。结果识别出 156 个数量性状位点(QTLs),验证了两个新基因。该研究为水稻育种基因挖掘提供新方法。
在全球人口不断增长的背景下,水稻作为至关重要的粮食作物,其产量提升迫在眉睫。从遗传学角度看,挖掘水稻遗传变异中的有益基因,是实现水稻遗传改良的关键。全基因组关联分析(Genome-Wide Association Study,GWAS)是探寻复杂性状相关功能基因的重要手段,能在广泛的种质资源中对相关基因进行高效探索与评估 。然而,GWAS 存在诸多局限性,比如对种群结构和样本量较为敏感,分析低频变异的能力有限,这使得其在定位新的数量性状位点(Quantitative Trait Locus,QTL)时效果不佳,无法充分解释一些复杂性状的遗传机制。为了解决这些问题,山西农业 大学和中国农业科学院深圳农业基因组研究所等机构的研究人员展开了一项大规模的 GWAS 荟萃分析研究。该研究成果发表在《Nature Communications》上,为水稻遗传研究和育种工作带来了新的突破。
研究人员为开展此项研究,运用了多种关键技术方法。首先,从 6 个独立的水稻种群面板收集了原始短测序数据和表型数据,涵盖来自 126 个国家或地区的 7765 份栽培稻种质资源。利用 Trimmomatic 进行测序数据质量控制,BWA 将数据映射到日本晴基因组,Sentieon pipeline 进行单核苷酸多态性(Single Nucleotide Polymorphism,SNP)检测,基于前期构建的泛基因组,借助 VG Giraffe 和 SURVIVOR 进行存在缺失变异(Presence/Absence Variation,PAV)检测。之后,通过 PLINK 进行主成分分析,GEMMA 计算亲缘关系,运用混合线性模型开展 GWAS 分析。对各面板的 GWAS 汇总数据,采用逆方差加权固定效应模型进行荟萃分析。