2024年7月17日, 约翰霍普金斯大学的研究人员在Nature发表了题为Sources of gene expression variation in a globally diverse human cohort的文章。
影响基因表达和剪接的遗传变异是表型多样性的一个重要来源。尽管这些研究很有价值,但调查人类中这些联系的研究却严重偏向于欧洲血统的参与者,这限制了研究的普遍性并阻碍了进化研究。
为了解决这些局限性,该研究开发了 MAGE,这是一个开放存取的淋巴母细胞系 RNA 测序数据集,来自 1000 基因组计划的 731 个个体,分布在 5 个大陆组和 26 个人群中。基因表达(92%)和剪接(95%)的大多数变异分布在人群内部和人群之间,这反映了 DNA 序列的变异。研究人员绘制了遗传变异与附近基因的表达和剪接之间的关联图(分别为顺式表达数量性状位点(eQTLs)和顺式剪接 QTLs(sQTLs))。
研究人员发现了超过 15,000 个推测为因果关系的 eQTL 和超过 16,000 个推测为因果关系的 sQTL,它们富集了相关的表观基因组特征。其中包括 1,310 个 eQTL 和 1,657 个 sQTL,它们在很大程度上不属于代表性不足的人群。该研究的数据进一步表明,eQTL 的因果效应的大小和方向在不同人群中高度一致。此外,以往研究中观察到的明显的 “种群特异性 ”效应在很大程度上是由低分辨率或未检测到的相同基因的额外独立 eQTLs 驱动的。
总之,该研究拓展了我们对人类基因表达多样性的理解,为研究人类基因组的进化和功能提供了一个包容性资源。