2024年4月5日,美国加州大学(尔湾)研究助理教授崔亚和讲席教授李蔚实验室在Cell杂志上发表题为A genome-wide spectrum of tandem repeat expansions in 338,963 humans的文章,该研究全面分析了33.9万人类全基因组测序数据,建立了第一个Biobank级别的人类多种族串联重复序列扩张遗传变异谱TR-gnomAD,促进TR expansions在人类遗传疾病中的研究。
在这项研究中,崔亚/李蔚团队对338963个人类全基因组测序数据的串联重复序列扩张进行了分析,绘制了86万TR在大规模人群中的遗传扩张变异谱(图1)。值得一提的是,该研究包含欧洲、非洲、西班牙裔、东亚和南亚等主要人群,其中39.5%(13万)为非欧洲人群数据。同时,该研究还包含13个子人群的全基因组数据,如中国、印度、爱沙尼亚、巴基斯坦、爱尔兰、古巴和中东及北非等人群。与该TR扩张变异谱进行比较,研究人员、临床医生和遗传咨询师可以容易的获得病人基因组中,与人群相比,异常或稀有的TR扩张(Outlier)。这些异常或稀有的TR扩张,可能是导致疾病发生的遗传致病因素。
在该研究中,崔亚/李蔚团队首次定义了TR差异分数(TR disparity score, TRDS)来量化不同人群TR重复数目频率分布的差异。有意思的是,作者还发现不同种族TR重复数目频率分布,可用于解释TR遗传疾病在不同种族中患病率的差异。比如,强直性肌营养不良1型(myotonic dystrophy type 1,DM1)在欧洲血统的人群中的患病率高于非洲人群。,以及弗里德赖希隐性遗传运动失调症(Friedreich's ataxia, FRDA)在欧洲血统的人群中的患病率高于东亚人群。另外,使用该TR扩张变异谱作为对照,结合疾病队列进行TR-GWAS分析,可以发现致病的TR异常扩张。
人群遗传变异谱对人类遗传疾病的研究是至关重要的。多年来,人群SNVs谱和SVs谱极大的促进了科学家对人类遗传疾病的了解和研究。该研究提供了第一个Biobank级别的人类串联重复序列扩张谱遗传变异谱TR-gnomAD,可以预见,TR-gnomAD将极大的促进了TR在人类遗传疾病的研究,为患有遗传疾病的家庭获得遗传诊断和治疗带来新的希望。