《Nature丨中国人群肝癌全基因组变异及演化特征》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2024-02-15
  • 2024年2月14日,海军军医大学王红阳院士/陈磊研究员课题组联合北京大学生物医学前沿创新中心/北京未来基因诊断高精尖创新中心白凡教授课题组、杜克-新加坡国立大学医学院Steven G. Rozen教授课题组以及福建和瑞基因吴琳博士团队合作在Nature在线发表了题为 Deep whole-genome analysis of 494 hepatocellular carcinomas 的最新研究成果。该研究完成了中国人群肝细胞癌全基因组深度特征分析(Chinese Liver Cancer Atlas, CLCA)。

    该研究对494例来自中国不同地区的肝细胞癌患者肿瘤组织进行了高深度的全基因组测序(平均120x),深入分析了编码区和非编码区的驱动基因、突变印记、拷贝数变异、聚集式变异事件(clustered alteration:chromothripsis, chromoplexy和kataegis)、染色体外环状DNA(extrachromosomal circular DNA, ecDNA)以及突变演进规律等特征,揭示了以HBV相关肝细胞癌为主的全基因组变异景观,为深入理解中国人群肝细胞癌的演进机理提供了重要的线索。

  • 原文来源:https://www.nature.com/articles/s41586-024-07054-3
相关报告
  • 《从1%到100%,中国人群泛基因组参考图谱登上《自然》》

    • 来源专题:战略生物资源
    • 编译者:郭文姣
    • 发布时间:2023-07-11
    • 近日,复旦大学、西安交大、中国医学科学院等26家单位联合发布了中国人群泛基因组联盟(CPC)一期研究进展。6月14日,相关成果以《基于36个族群的中国人泛基因组参考图谱》(A Pangenome Reference of 36 Chinese populations)为题发表于《自然》(Nature)主刊。 这项研究初步构建了中国人群的泛基因组参考图谱,发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列;新鉴定了约580万个点突变或小变异以及3.4万个结构变异;并发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA 修复、免疫反应以及寿命等表型或功能相关。在重构人类演化历程、挽回复杂疾病研究时“丢失的遗传率”等研究和应用中,该图谱具有巨大的潜在价值。 人类参考基因组是广泛用于人类遗传学和医学研究的遗传密码“导航图”,也是解析人类起源与演化、解析人类表型和疾病的遗传基础的根基。从2001年首次发表人类基因组草图,人类参考基因组经历了数十次的更新迭代。直到2022年 “端粒到端粒”联盟(T2T)构建的“无缺口”的T2T-CHM13参考基因组完成图,所有涉及人类遗传学的研究仍然依赖于线性参考基因组。今年正值国际人类基因组计划(HGP)完成20周年,人类参考基因组从“线性一维序列”过渡到“泛基因组多维图谱”。泛基因组(Pangenome)进一步借助图论的思想和计算技术,将人类多个族群的代表性样本的具有多样性的基因序列以多维图谱形式组装起来,形成一个能充分反映种群基因组结构变异多样性的导航图,从而指导进一步的遗传学和医学研究。 在人类基因组计划成立之初,主要的人类参考基因组皆基于高加索人种为主体样本构建,难以代表其他族群的基因组多样性。作为世界人口大国,中国有着丰富的人群多样性。构建具有代表性的中国人群泛基因组图谱,将极大提高捕获罕见或低频遗传变异的灵敏度和准确性,有望应用于复杂疾病的分子机制研究,以及精准医学研究。为了构建高质量高精度的中国人群泛基因组参考图谱,复旦大学徐书华教授、西安交通大学叶凯教授联合中国26家单位发起了中国人群泛基因组联盟(Chinese Pangenome Consortium, CPC)。在其第一期研究计划中,CPC对代表中国36个族群的58个样本采用最新的第三代高保真基因组测序技术进行了深度测序,结合最新的单倍型基因组组装方法,获取了116个高质量单倍型基因组,并以图基因组的方式构建了高质量中国人群参考泛基因组。该泛基因组图谱总共包含约3.01 Gb个碱基对的序列信息,在现有人类参考基因组的基础上新增了约1.9亿个碱基对的新序列,包含约590万个小变异(单核苷酸多态性变异和小规模插入/缺失变异)和约3.4万个结构变异(Structural variation, SV),涉及至少1367个蛋白编码基因复制事件等。其中,约500万个碱基对新序列存在于95%以上的单倍型中,被视为中国人群基因组核心序列,可能与中国人群特有的较为稳定的生物学功能或表型特征相关。CPC泛基因组图谱作为首个中国人群专属的泛基因组参考图谱,与HPRC泛基因组图谱相比,在中国人群特有的复杂变异解析方面具有显著优势。CPC泛基因组图谱中新发现了1079个基因拷贝数变异,以及包含药物代谢基因CYP2D6等在内的在中国人群中富集而在其他世界人群中出现频率较低的若干基因拷贝数变异;新鉴定出富集在中心粒、端粒等染色体复杂区域的3.4万个结构变异,其中半数以上仅在单个或两个样本中出现——若不针对中国丰富的族群多样性开展专门研究,将没有机会发现这些遗传变异。 研究人员进一步揭示,这些CPC新发现的遗传变异可能与亚洲人群特有的疾病易感性及表型多样性有关。一个典型的例子是α-珠蛋白基因簇,研究人员在该基因区域鉴定出***人群特异性的大规模结构变异,包括一段20 kb的缺失序列和一段10 kb的重复序列,这将为进一步研究中国人群贫血症的遗传机理和致病机制提供新的线索。同时,CPC新发现的遗传变异影响了具有潜在功能和经受过适应性进化的基因,这些基因可能与亚洲人群特有的疾病易感性及表型多样性有关,这也证实了将人群专属高质量泛基因组用于基因组学和医学研究的潜力和必要性。此外,研究人员在CPC参考图谱中发现了相当大比例的古人来源基因序列——平均每个族群和每个样本中分别有约15 Mb和约9.5 Mb的古人来源新序列——这可能是前期开展大量研究却未在现代人基因组中发现的古人基因渗入序列,或将为东亚现代人基因组中的古人基因渗入研究乃至整个古DNA领域提供新的信息资料和线索。 从人类基因组计划中国只承担“1%”的图谱绘制任务到今天中国人群泛基因组图谱“100%”由中国科学家完成,这项研究成果展现了中国生命科学尤其是基因组学科研水平在过去40年间的历史性跨越,为完整构建中国人群参考泛基因组打下了坚实的基础,也为人类参考泛基因组图谱绘制了“中国画卷”。中国人群参考泛基因组不仅有助于加速遗传学研究,加深人们对个体或群体基因组的“异”与“同”更具象、更深度的认知,还将改变过去依赖主体基于高加索人种的参考基因组而导致东亚特有罕见变异检出精确度难以提升的困境,从而提高中国生物医学数据分析的质量和效率,服务人民生命健康。 复旦大学徐书华教授、西安交通大学叶凯教授、中国医学科学院褚嘉祐教授和复旦大学陆艳副教授为论文的共同通讯作者。复旦大学博士后高扬,西安交通大学杨晓飞副教授,中国科学院上海营养与健康研究所博士生陈豪、谭昕江,中国医学科学院杨昭庆研究员以及复旦大学邓恋青年研究员为论文的并列第一作者。该论文共同作者包括复旦大学王宝楠、孔爽、李松洋、崔雨杭、雷畅、赵晓涵、史颖冰、杨子艺,中国科学院王亦民博士、潘雨闻博士、马森博士,中国医科院孙浩博士,中国科学院昆明动物所吴东东研究员,江苏师范大学伍少远教授,复旦大学赵兴明教授,西安交大附属医院施秉银教授,复旦大学金力教授,南京医科大学胡志斌教授等。 中国人群泛基因组图谱已公开在线发布:https://pog.fudan.edu.cn/cpc/#/https://github.com/Shuhua-Group/Chinese-Pangenome-Consortium-Phase-I 该项研究所涉及的样本信息和数据的公开发表已获得国家人类遗传资源管理部门批准。该项研究得到了国家自然科学基金重点项目、基础科学中心、国家重点研发计划等项目的资助。 附:中国人泛基因组联盟(1期)成员徐书华(复旦大学)、叶凯(西安交通大学)、褚嘉祐(中国医学科学院)、金力(复旦大学)、杨昭庆(中国医学科学院)、吴东东(中国科学院昆明动物研究所)、胡志斌(南京医科大学)、赵兴明(复旦大学)、袁慧军(四川大学华西医院)、高强(复旦大学附属中山医院)、金鑫(华大生命科学研究院)、陈超(中南大学)、李津臣(中南大学)、杨剑(西湖大学)、伍少远(江苏师范大学)、陆艳(复旦大学)、沈侠(复旦大学)、杨晓飞(西安交通大学)、邓恋(复旦大学)、樊少华(复旦大学)、戴俊程(南京医科大学)、施秉银(西安交通大学)、韦朝春(上海交通大学)、孙浩(中国医学科学院)、何光林(四川大学华西医院)、卜枫啸(四川大学华西医院)、吴洋(四川大学华西医院)、高扬(复旦大学)、陈豪(中国科学院上海营养与健康研究所)、谭昕江(中国科学院上海营养与健康研究所)、王亦民(中国科学院上海营养与健康研究所)、王宝楠(复旦大学)、李松洋(复旦大学)、崔雨杭(复旦大学)、潘雨闻(中国科学院上海营养与健康研究所)、马森(中国科学院上海营养与健康研究所)、孔爽(复旦大学)、赵晓涵(复旦大学)、毛创学(中国科学院上海营养与健康研究所)、雷畅(复旦大学)、史颖冰(复旦大学)、杨子艺(复旦大学) 专家点评: 赵国屏(中国科学院院士) 由复旦大学、西安交大、中国医学科学院等研究单位的一批中青年学者组织的“中国人泛基因组联盟”,汇聚中国各方面多年努力积累的数据,构建出高质量的中国人群泛基因组图谱,在国际顶级科学期刊Nature正式发表,是一件值得庆贺和重视的大事。 人类基因组计划(HGP)最主要的成果就是构建了一个沿用至今并在不断完善中的人类参考基因组(reference genome)。人类参考基因组之所以重要和有用,因为人类虽然是一个物种,其基因组大致相似(如果不考虑结构变异,在组成人类基因组的30亿个碱基对中,大约99.9%是一致的),然而,人类个体的基因组又是各不相同的;而正是这0.1%左右(大约三百万碱基对)的不同,造成了人类各族群、个体间表型不同(从长相的不同到健康状况的差异)的遗传基础。所以,要能够正确使用人类基因组序列,帮助我们认识人类自身特别是与我们健康密切相关的基因组信息,以获得有价值的知识,必须有一张能够指导待研究对象的基因排序和组合的导航图,这就是人类参考基因组。 这张被广泛应用于人类遗传学和医学研究的遗传密码“导航图”,是解析人类起源与演化、解析人类表型和疾病的遗传基础的根基。20年前人类基因组计划完成之初,用于国际基因组计划(HGP)的大部分DNA来自于住在纽约州布法罗的一名白人男性捐献者(编号为RP11)。同时公布的来自Craig Venter领导的塞雷拉基因組计划的DNA样品来源于五名捐献者,其中虽然有亚裔和非洲裔人,依然是高加索人为主。因此,通用的人类参考基因组代表的是以高加索人为主的基因组序列。 今年正值国际人类基因组计划(HGP)完成20周年,也成为人类参考基因组从“线性一维序列”过渡到“泛基因组多维图谱”的转折年。值此历史发展重要转折点,复旦大学、西安交大、中国医学科学院等研究单位的一批中青年学者,能独立自主地构建出高质量的中国人群泛基因组图谱,最终得到国际顶级期刊的认可和发表,这是值得肯定的,也是需要鼓励和支持的。这一成果表明中国科学家在人类基因组学领域的研究水平得到了显著提升。我相信这项工作对中国的人类基因组学和医学中的复杂疾病遗传基础研究等领域会起到重要的推动作用! 张亚平(中国科学院院士) 基因组是生命演化的遗传信息载体,也是研究人类起源和复杂疾病的数据信息根源。不论是动植物,还是人类,复杂性状的遗传学研究都遇到了一个瓶颈——“missing heritability”(丢失的遗传率)问题,即目前的研究未能鉴别出能充分解释表型预期遗传贡献的基因变异。这部分与参考基因组的不完整性和多样性覆盖度不充分有关。虽然国际上也发起了以欧美发达国家主导的重构人类参考基因组的计划,然而,是否有必要建立中国人群的参考基因组是应该认真对待的问题。 徐书华团队在前期研究中从变异判读、进化研究、医学应用三个方面分析和评估了建立高质量族群特异性参考基因组的必要性。此次复旦大学、西安交大、中国医学科学院等多家单位联合发布的中国人泛基因组研究成果,再次表明了建立中国人群泛基因组图谱的必要性以及该图谱在重构人类演化历程和挽回复杂疾病研究中“丢失的遗传率”等研究和应用中的潜在价值。 金力(中国科学院院士) 人类基因组研究是基因组学中起步最早的方向,在数据资源、技术方法和研究成果等方面都曾领先于其他物种的研究。但是,这种“先发优势”也使得人类基因组研究越来越难以取得新的突破性成果。近年来,动物、植物、非人灵长类、反刍动物等领域的基因组学研究进展很快,取得了令人瞩目的成绩。相比之下,人类基因组研究显得有所“滞后”。而此次发表的成果,打破了人类基因组学研究的这种“停滞”,也是中国科学家在人类基因组研究领域取得的又一重大进展。 很有意思的是,这项研究发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA 修复、免疫反应以及寿命等表型或功能相关。这反映了我们的基因组中可能仍有大片有价值的矿藏尚未得到充分开采。 值得注意的是,这项研究除了在通用参考基因组之外发现约590万个单核苷酸多态性变异和插入/缺失变异之外,还鉴别出约3.4万个结构变异(Structural variation, SV),并且涉及至少1367个蛋白编码基因。我想强调的是,基因组结构变异大概是生物进化中从微观到宏观演变的关键遗传基础,也是最有可能连接渐变到跃变这个“鸿沟”的进化密码。我相信,通过对基因组结构变异的高精度解析,不但能大幅提升“基因型-表型”关联分析的功效,而且有可能最终帮助我们理解生命演化中重要性状和功能产生的遗传基础和分子机制。
  • 《Nature子刊综述深度解读!如何利用微生物组的基因组特性来预测癌症的发生及进展?》

    • 来源专题:中国科学院病毒学领域知识资源中心
    • 编译者:malili
    • 发布时间:2020-06-01
    • 2020年5月28日 讯 /生物谷BIOON/ --近日,一项刊登在国际杂志Nature Cancer上题为“Microbiome genomics for cancer prediction”的综述文章中,来自魏茨曼科学研究所等机构的科学家们论述了如何利用微生物组的基因组学特征来进行癌症预测。 尽管癌症基因组学能作为一种强大的工具帮助理解癌症发病机制并帮助开发新型诊断工具,但目前研究人员却很少研究维生素组在癌症诊断和临床疗法评估中扮演的关键角色,这项研究中,研究者Elinav等人就论述了通过研究癌症的宏基因组如何能够促进不同肿瘤类型的识别、诊断和分级。 研究人员对小鼠和人类进行的大量研究表明,微生物组的改变或与癌症的发生、发展和对疗法的反应直接相关,而宿主微生物组与癌症病理学之间的一种可能性的链接就是微生物所产生的代谢产物,这些潜在的生物活性分子可以在肿瘤局部或远端产生,其能够系统性地涌入宿主体内并影响肿瘤相关的过程;微生物代谢产物的特性及其效应子功能可能也会在拥有不同微生物组或暴露于不同饮食、药物或其它环境因素的个体之间产生差异,在癌症或其疗法反应的背景下,这些微生物组衍生的分子的组合或许是有益的,也可能是有害的;同时通过分析患者机体的宏基因组特征,还能提供一种病人特殊的化学特征,并与微生物生态系统组成的分析相结合,这或许就为患者个性化的干预提供了一种新的视角。 尽管对癌症发生分子基础的全面描述主要集中在人类基因组的改变上,但最近的研究报告却发现了特殊癌症类型和特定微生物组蓝图之间的关联;然而,研究人员并不是非常清楚这种关联之间的程度,以及其对癌症诊断、预后和治疗所产生的影响;基于对细菌和病毒与特性类型癌症之间关联的了解,研究者就开始对TCGA计划中超过1万名癌症患者中涉及33种癌症类型的1.8万多份肿瘤样本进行全基因组和RNA测序数据进行分析,经过严格的筛选和分类,研究人员利用这些样本中的微生物DNA序列开发了一种新型算法,其能够有效区分15种不同的癌症组织和正常组织,并对癌症类型进行分类,同时研究者还能利用基于组织的微生物模型来区分I期和IV期癌症,这些在结肠癌、胃癌和肾脏癌症中都表现良好,而在其它类型的癌症中就表现地有限。深入分析来自结肠癌等癌症患者机体的样本就能帮助建立不同类型癌症与微生物遗传特性之间的关联,即结肠癌中存在的梭菌属、宫颈癌中存在的Alphapapillomavirus genus等。 随后研究者进一步研究利用来自TCGA血液样本的测序数据来检测微生物DNA(mbDNA)的特征并且检测是否这种新型算法能够预测不同类型癌症的存在;值得注意的是,将这种经过TCGA训练的机器学习分类技术应用于血液样本衍生的mbDNA特征上,并与不同类型癌症的存在相关联。随后研究人员将他们的研究结果与现有的ctDNA试验进行了比较,结果发现,mbDNA能有效区分Ia和IIc期的癌症及并未检测到基因组改变的肿瘤,从而就能为传统ctDNA方法提供新的工具。最后,利用从独立临床队列参与者机体的血浆样本中提取的无细胞DNA的宏基因组测序方法,研究者发现,这种方法能够区分健康个体和癌症患者,同时还能区分前列腺癌和肺癌患者等;总之,通过对肿瘤和循环mbDNA特征进行深入研究,研究人员就能提供一种创新性的方法,将癌症患者从健康个体中筛选出来,并且能区分特殊的癌症类型,在某些情况下还能识别早期和晚期癌症患者。 这项研究补充了过去一些强调微生物组在癌症中重要性的报告,来自人类微生物组研究计划的数据显示,人类机体微生物的特征会表现出时间和空间上的变化。尽管饮食、环境、宿主机体遗传因素和早期微生物的暴露都是造成这种异质性的原因,但这种多样性在很大程度上依然无法解释,最近有研究表明,不同原发性癌症(其中许多发生在胃肠道)中存在的细菌会影响癌症患者的预后表现。相关研究发现或许并不局限于原发性肿瘤,有意思的是,相同的细菌也可以在同一患者的转移性肿瘤中发现,这就表明,原发性肿瘤和转移性肿瘤之间或会表现出微生物组的稳定性。尽管目前研究人员对癌症中微生物组所扮演的生物学功能的了解仍然有限,但我们都知道,微生物组会影响患者的疗法预后以及其对常规化疗和免疫疗法的反应。 癌症诊断的金标准技术依赖于活组织检查,随后由病理学家对活组织进行显微镜检查,对患者的癌症进行遗传学分析通常会寻找遗传改变,从而就能帮助指导有关靶向疗法方案的决策;液体活检是一种新型方法,其能对循环肿瘤细胞进行分析研究,但其主要是用于监测在肿瘤治疗或手术后辅助治疗中已经确诊的癌症患者;研究者Galon等人开发的免疫评分技术就能通过测定肿瘤位点的宿主免疫反应来确定早期结肠癌患者的疾病复发风险。 为了理解利用微生物DNA对癌症患者效益的潜在临床意义,研究者就需要将研究结果置于当前癌症诊断和临床随访方法的背景下进行;从这个角度来讲,研究人员发现了一些非常有趣的结果,首先,他们能够识别出早期癌症患者,并未对基因组变异进行监测,而基于ctDNA的分析就能够得出证据;其次,在某些情况下,研究者能够正确地将癌症患者分类到特定的阶段,这优于其它液体活检方法,相关研究发现就表明,mbDNA监测方法能帮助识别早期(仍可治愈)癌症患者,并能作为一种快速的癌症筛查工具。 尽管这些发现具有非常明显的临床意义,但科学家们仍然有一些问题需要解决,比如,是否能利用微生物组的特征来预测癌症的发生及进展;未来的研究也需要提供明确的证据来证实这种潜在强大工具的有效性,另一个有趣的问题就是,这些微生物组的特征是否真的能够改变患者的治疗情况,在这种情况下,其就能作为一种指示患者预后和监测的生物标志物。很显然,这种方法还需要进一步测试和验证,因此后期研究者可能还需要一段时间,直到相关的测试通过了监管部门的评估和临床实践的应用,后期研究者还将继续在更大的人群队列和不同类型的癌症患者中进行后续研究。(生物谷Bioon.com) 参考资料: Adlung, L., Elinav, E., Greten, T.F. et al. Microbiome genomics for cancer prediction. Nat Cancer 1, 379–381 (2020).doi:10.1038/s43018-020-0059-x 原文链接:http://news.bioon.com/article/6756374.html