《Nature | 基于计算生成的IDRs蛋白质构象研究其与细胞功能和定位的关联性,关于序列-结构-功能的探究》

  • 来源专题:战略生物资源
  • 编译者: 李康音
  • 发布时间:2024-02-03
  • 2024年1月31日,哥本哈根大学的研究人员在Nature期刊上发表了一篇题为Conformational ensembles of the human intrinsically disordered proteome的研究文章。

    蛋白质中存在一种被科学家忽视了的重要部分,叫做内在无序区域(IDRs)。IDRs是指那些没有固定的三维结构,而是可以变形的蛋白质片段。这些IDRs占据了蛋白质的一半左右,但是由于它们不能和其他生物分子很好地配合,所以一直被认为没有什么重要的功能。近年来研究表明IDRs在细胞生物学起到了重大作用,其中可能存在疾病治疗靶点,这篇文章主要研究了这一类蛋白构象集合特点与细胞功能、生物学过程的关联。

    该文章详细探讨了人体蛋白质组中的的内在无序区域(IDRs)。研究通过CALVADOS分子模型生成的IDRs构象集合,分析其构象属性、细胞功能和定位,探讨了IDRs的序列压缩关系和在正交同源体中的进化保守性。研究结果为理解IDRs在蛋白质功能中的角色以及其与人类疾病关系提供了全面视角。论文最后讨论了IDRs中致病变异的发生率,阐述了压缩的进化保守性及其与生物功能和疾病的关联。

  • 原文来源:https://www.nature.com/articles/s41586-023-07004-5
相关报告
  • 《新技术实现蛋白质在细胞内的高通量、高分辨结构解析》

    • 来源专题:生物育种
    • 编译者:姜丽华
    • 发布时间:2023-04-09
    • 冷冻电镜单颗粒技术实现了解析溶液中蛋白质的结构达到近原子分辨率,甚至在apoferritin上达到原子分辨率。然而,在工作状态的细胞环境中的蛋白质往往具有更多的原生构象,并可能形成比纯化蛋白质更完整的复合物,因此实现高分辨的原位蛋白质结构解析是目前冷冻电镜的重要目标之一。   冷冻电子断层(cryo-ET)结合亚单位平均是目前实现蛋白质原位结构解析的通用方案,但断层要求对每一个区域收集倾转序列,这降低了原位的数据采集通量,且倾转序列之间存在对中误差和冰层畸变等问题,导致分辨率难以突破。   为了实现原位蛋白质的高通量、高分辨率结构解析,中国科学院生物物理研究所章新政组致力于开发不基于电子断层的新型原位结构解析算法。近日,《自然-通讯》(Nature Communications)在线发表了章新政组撰写的题为Determining protein structures in cellular lamella at pseudo-atomic resolution by GisSPA的研究论文。该研究基于课题组2021年发表的isSPA算法进行GPU加速优化,将计算效率提高了约400-500倍。   该工作将FIB减薄的细胞样品作为测试数据,使用GisSPA分别解析了细胞中的分子量约为14.7 MD的藻胆体和分子量约为1.5MD的光系统II复合物的高分辨结构,其分辨率分别为3.4埃和3.9埃(图1)。此外,该研究还探索了GisSPA算法针对不同分子量大小的蛋白质和切片厚度的适用范围。结论认为在切片厚度为100-150纳米时,可解析的最小复合物的分子量约为1.1 MD(图2)。该方法较断层重构数据采集效率提升了30~40倍,解析分辨率也获得显著提升。   上述工作由生物物理所、北京理工大学、中国科学院计算技术研究所的科研人员合作完成。研究工作国家重点研发计划、国家自然科学基金、中国科学院战略性先导科技专项(B类)、中国科学院基础前沿科学重点研究计划等的支持。   此外,上述研究中的FIB样品来自于清华大学隋森芳团队。隋森芳团队应用isSPA算法与电子断层的结合探究了红藻的PBS-PSII-PSI-LHC巨型复合物。isSPA算法将复合物的分辨率提高至3.3埃。该成果(In situ structure of the red algal phycobilisome-PSII-PSI-LHC megacomplex)同日在线发表在《自然》(Nature)上。相关工作由清华大学和生物物理所的科研人员合作完成。   章新政课题组致力于新型原位结构解析技术的开发。基于此,课题组开发了蛋白质识别算法,并对探测函数的最优权重进行推导。新函数提升了叠合密度中探测目标蛋白的效率。结合排序函数减少蛋白质识别算法引入的假阳性数据,有效减轻模型偏差的影响,实现高分辨重构。
  • 《研究揭示三维基因组的单分子拓扑结构多样性和细胞异质性》

    • 来源专题:转基因生物新品种培育
    • 编译者:姜丽华
    • 发布时间:2023-03-08
    •   高等真核生物基因组存在复杂的三维空间结构,在不同尺度下形成如染色质环(Chromatin loops)、拓扑关联结构域(TADs)、活性/非活性染色质区室(A/B compartments)和染色体域(Chromosome territories)。这些结构对于基因组稳定性的维持、基因表达的精准调控具有重要作用,从而影响细胞命运决定和表型建立。经典的基因组三维结构主要通过染色体构象捕获(3C)及其衍生方法如4Cs、5C、Hi-C、ChIA-PET为代表的多种形式的高通量技术揭示。这些技术可以捕获细胞核内空间相邻的成对DNA序列,但无法捕获细胞群体中基因组内协同的多位点相互作用(multi-way contact)和单分子拓扑结构(single-allele topology)。此外,基因组3D结构在细胞周期、发育和分化过程中动态变化,且与多个基因及调控区间的染色质相互作用相关。获得细胞群体中的染色体单分子拓扑结构对于探究基因组的动态折叠机制和与基因调控功能的关联性颇为重要。     近年来,多个实验室建立了如ChIA-drop、split-pool recognition of interactions by tag extension(SPRITE)、Tri-C、multi-contact 4C和Pore-C等方法,用于探讨染色质多位点协同相互作用和群体细胞的染色体单分子拓扑结构的捕获。这些方法中,Pore-C具有技术简单,且可以同步捕获全基因组高阶多位点互作信息和DNA甲基化修饰的优点。   3月6日,中国科学院昆明动物研究所研究员侯春晖团队与中山大学中山眼科中心副研究员肖传乐团队合作,在《自然-通讯》(Nature Communications)上,发表了题为High-throughput Pore-C reveals the single-allele topology and cell type-specificity of 3D genome folding的研究论文。该工作优化建立了高通量的Pore-C方法,显著增加了高阶染色质互作的检测通量,并揭示了三维基因组的单分子拓扑结构多样性和细胞特异性。   研究发现,Pore-C技术测序通量相对较低的原因可能是与DNA交联的蛋白质没有被完全去除而导致测序纳米孔芯堵塞。为了解决这一问题,研究优化了酶解条件,测试了多次蛋白酶解和使用混合蛋白酶的策略,提高了测序产量约80%,近乎成倍降低了该技术的使用成本。此外,研究通过整合NGMLR和Minimap2比对算法开发了MapPore-C比对流程,显著改善了比对准确性和数据利用率低的问题,同时,研究通过与Hi-C数据比较,验证了HiPore-C能够高度重现基于Hi-C捕获的染色质环、拓扑相关结构域和染色质区室等基因组3D结构。进一步,研究探索了染色体间高阶互作发现,多数互作并非发生在端粒和中心粒之间,而是发生在基因组区域,且形成两个转录活性不同的互作枢纽,其中一个枢纽基因密度、增强子密度和活跃状态染色质相关的表观遗传修饰水平均更高。研究还发现,多个染色体的tRNA基因富集区域之间发生跨染色体的高频相互作用,HiPore-C高阶互作不仅发生在TAD和compartment内部,而且能够跨越多个区室、拓扑相关域和染色质环,基于直接和间接的DNA片段间相互作用构建的染色质互作图谱与常规Hi-C图谱总体相似,但间接DNA片段互作更加倾向跨越多个结构单元。上述研究揭示了跨染色质结构域互作存在的广泛性,并突出了HiPore-C技术在单分子水平解析基因组三维高阶互作的优势和重要性。   研究通过分层聚类的方法,讨论了不同类型细胞的拓扑结构中呈现的单分子拓扑结构集群。这些结构集群是类亚TAD(subTAD-like)结构域形成的基础,具有明显的细胞特异性,表明单分子拓扑结构多样性是细胞群体TAD结构域划分的基础,对探讨基因组空间结构组织和细胞特异的基因表达间的关系具有重要意义。此外,研究使用HiPore-C数据比较了红系K562和淋巴系GM12878细胞中在β-globin locus的高阶互作。结果发现,人ε-和γ-珠蛋白基因启动子和多个增强子之间形成了多位点同时互作、细胞特异的增强子-启动子中心,这种相互作用可能是动态的。研究分析了HiPore-C同时捕获染色质高阶互作和DNA甲基化状态的能力,发现了DNA甲基化信号与染色质环锚点间相互作用强度呈正相关,此外,可根据DNA甲基化水平准确地区分染色质区室的类型(A vs B)。   该研究建立了HiPore-C技术,可全面描述单分子拓扑结构的多样性,揭示的单分子拓扑结构的动态折叠比以前想象的更为复杂,进一步提升了关于三维基因组折叠规律的认知。