《Nature | 983578 个个体的蛋白质编码变异深度目录》

  • 编译者: 李康音
  • 发布时间:2024-05-26
  • 2024年5月20日,美国再生元基因中心的研究人员在 Nature 期刊发表了题为A deep catalogue of protein-coding variation in 983,578 individuals的文章。

    对功能有重大影响的罕见编码变异有助于深入了解基因的生物学特性。然而,确定其频率需要大量样本。该研究展示了人类蛋白质编码变异的目录,该目录来自不同人群中 983,578 个个体的外显子测序。再生元基因中心百万外显子组数据(RGC-ME)中有 23% 来自非洲、东亚、美洲土著、中东和南亚血统的非欧洲人。该目录包括 1040 多万个错义变异和 110 多万个预测功能缺失 (pLOF) 变异。研究人员在 4,848 个基因中发现了具有罕见的双拷贝 pLOF 变异的个体,其中 1,751 个基因以前从未报道过。

    通过对杂合功能缺失选择的精确定量估计,研究人员确定了 3,988 个不耐受功能缺失的基因,其中包括 86 个以前被评估为耐受的基因和 1,153 个缺乏既定疾病注释的基因。研究人员还确定了高分辨率的错义缺失区域。值得注意的是,有 1,482 个基因尽管对 pLOF 变异具有耐受性,但其错义变体区域却已耗尽。最后,研究人员估计有 3% 的个体存在可用于临床的基因变异,而 ClinVar 中报告的 11,773 个意义不明的变异很可能是有害的隐性剪接位点。为了方便对变异的解释和以遗传学为依据的精准医疗,研究人员通过一个公开的变异等位基因频率浏览器,提供来自 RGC-ME 的这一重要编码变异资源。

相关报告
  • 《Nature | 超越蛋白质:AlphaFold3预测复杂生物分子结构》

    • 编译者:李康音
    • 发布时间:2024-05-10
    • 2024年5月8日,谷歌Deep Mind的John M. Jumper通讯在Nature发表题为Accurate structure prediction of biomolecular interactions with AlphaFold 3的文章,推出了AlphaFold 3(AF3),能够超高精度预测各种生物分子复合物的结构。这一成就代表着我们理解和操纵控制生物系统的复杂相互作用的能力的重大飞跃。 在其前身AlphaFold 2的成功基础上,新模型引入了实质性的架构和训练程序增强,以适应更广泛的化学结构,并提高数据效率。AF3的核心是一种基于扩散的方法,该方法直接预测原始原子坐标,无需专门处理键合模式和立体化学约束。AF3的真正威力在于其在不同生物分子相互作用中的卓越准确性。值得注意的是,AF3在预测蛋白质配体、蛋白质核酸和抗体抗原相互作用方面优于专业工具,甚至超过了最先进的对接方法。这种准确性延伸到涉及蛋白质、核酸、小分子、离子和修饰残基的复杂结构。 AF3的关键优势之一是其准确模拟共价修饰的能力,如键合配体、糖基化以及修饰的蛋白质和核酸残基。这种能力对于理解生物学过程背后复杂的分子机制和开发有针对性的治疗干预措施至关重要。研究人员使用最近的接口特定基准(interface-specific benchmark)仔细评估了AF3的性能,证明其优于已知最先进的方法。此外,该模型的置信度测量密切跟踪其准确性,为研究人员提供了一个可靠的预测可靠性指标。 虽然AF3代表着向前迈出的一大步,但研究人员承认存在某些局限性。其中包括偶尔的立体化学侵犯(stereochemical violation),如手性误差和原子碰撞,以及准确预测动力学行为和构象状态的挑战。此外,对某些目标的高度准确的预测可能需要生成多个预测并对其进行排序,从而产生额外的计算成本。 尽管存在这些局限性,但AlphaFold 3的开发是生物分子结构预测领域的一项变革性成就。通过在统一的深度学习框架内对广泛的生物分子相互作用进行准确建模,AF3有望加速我们对细胞调节的理解,并为合理的治疗设计铺平道路。随着计算和实验方法继续并行发展,这些方法之间的协同作用无疑将推动我们进入一个前所未有的结构见解时代,开启生物学理解和治疗发展的新前沿。
  • 《Nature | 通过核小体阅读器的蛋白质组学分析解码染色质状态》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-03-13
    • 2024年3月6日,伦敦帝国学院的研究人员在Nature发表题为Decoding chromatin states by proteomic profiling of nucleosome readers的文章。 该文章介绍了一个关于染色质状态如何被染色质读取器解码的研究。研究使用多维蛋白质组学策略系统地研究了大约2,000种核蛋白与代表启动子、增强子和异染色质状态的80多个修饰二核苷酸体结合的相互作用。通过将复杂的核小体结合谱解析为共调控蛋白质网络和驱动蛋白质招募或排斥的明显核小体特征网络,研究全面展示了染色质状态如何被染色质读取器解码。 研究发现不同特征具有高度独特的结合响应,许多因子能识别多个特征,核小体修饰和连接DNA在调控蛋白质与染色质结合中起着主要独立的作用。他们提供了一个名为"Modification Atlas of Regulation by Chromatin States (MARCS)"的在线资源,提供深入分析工具,以促进对染色质状态调控基本原则的发现。