《Nature | 序列特异性 DNA 结合蛋白的计算设计》

  • 来源专题:战略生物资源
  • 编译者: 朱晓琳
  • 发布时间:2025-09-14
  •     序列特异性 DNA 结合蛋白(DBPs)在生物学和生物技术领域发挥关键作用,人们对设计具有新特异性或改变后特异性的 DBPs 用于基因组编辑等应用抱有浓厚兴趣。尽管通过筛选方法对天然 DBPs 进行重编程已取得一定成功,但设计能识别任意目标位点的新型 DBPs 仍面临重大挑战。

        本文介绍了一种计算设计方法,可生成能通过与 DNA 大沟中碱基相互作用来识别短特异性目标序列的小型 DBPs。利用该方法,研究人员针对 5 个不同的 DNA 靶点设计出结合剂,其亲和力达到中纳摩尔至高三纳摩尔水平。单个结合模块在多达 6 个碱基对位置上的特异性与计算模型高度匹配,且通过 RFdiffusion 将结合剂沿 DNA 双螺旋刚性定位,可实现更高阶的特异性。

        经测定,设计的 DBP - 靶点复合物的晶体结构与设计模型高度一致,且这些设计的 DBPs 在大肠杆菌和哺乳动物细胞中均能发挥功能,可抑制和激活邻近基因的转录。此外,研究还通过酵母展示细胞分选进行 DBP 的生成与筛选,通过 X 射线共晶学和 DBP 足迹分析验证设计的有效性,对 DBP 特异性进行评估与优化,并证实设计的 DBPs 能在活细胞中调节转录。

        该方法为生成小型且易于递送的序列特异性 DBPs 提供了途径,可用于基因调控和编辑,在合成生物学及其他需要序列特异性 DNA 识别的领域具有广泛应用前景。

    序列特异性 DNA 结合蛋白(DBPs)在生物学和生物技术领域发挥关键作用,人们对设计具有新特异性或改变后特异性的 DBPs 用于基因组编辑等应用抱有浓厚兴趣。尽管通过筛选方法对天然 DBPs 进行重编程已取得一定成功,但设计能识别任意目标位点的新型 DBPs 仍面临重大挑战。

    本文介绍了一种计算设计方法,可生成能通过与 DNA 大沟中碱基相互作用来识别短特异性目标序列的小型 DBPs。利用该方法,研究人员针对 5 个不同的 DNA 靶点设计出结合剂,其亲和力达到中纳摩尔至高三纳摩尔水平。单个结合模块在多达 6 个碱基对位置上的特异性与计算模型高度匹配,且通过 RFdiffusion 将结合剂沿 DNA 双螺旋刚性定位,可实现更高阶的特异性。

    经测定,设计的 DBP - 靶点复合物的晶体结构与设计模型高度一致,且这些设计的 DBPs 在大肠杆菌和哺乳动物细胞中均能发挥功能,可抑制和激活邻近基因的转录。此外,研究还通过酵母展示细胞分选进行 DBP 的生成与筛选,通过 X 射线共晶学和 DBP 足迹分析验证设计的有效性,对 DBP 特异性进行评估与优化,并证实设计的 DBPs 能在活细胞中调节转录。

    该方法为生成小型且易于递送的序列特异性 DBPs 提供了途径,可用于基因调控和编辑,在合成生物学及其他需要序列特异性 DNA 识别的领域具有广泛应用前景。


  • 原文来源:https://www.nature.com/articles/s41594-025-01669-4
相关报告
  • 《Science | 具有可预测结合能量和特异性的药物结合蛋白的全新设计》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-04-10
    • 2024年4月4日,加州大学旧金山分校药物化学系和心血管研究所的William F. DeGrado等人在Science发表了题为De novo design of drug-binding proteins with predictable binding energy and specificity的文章。 人工智能实现的构象和序列空间采样与基于物理的模型无缝对接,设计了具有精确预定义的结合亲和力、特异性的蛋白质。该方法(结合位点聚合基序Convergent Motifs for Binding Sites[COMBS]),可以在寻找完成结合位点的特异性和方向性较差但能量有利的范德华和疏水相互作用之前,仅对能够形成这种相互作用的序列和结构进行采样。为了实现复杂极性分子的结合,对配体-蛋白质相互作用的有利几何形状进行采样是至关重要的。 尽管vdMs和COMBS是与rosetta序列设计结合使用,但也可以很容易地用于改进各种最近开发的基于条件扩散模型的蛋白质设计算法的采样和/或评分。从头蛋白的MD模拟仅偶尔用于深入了解从头蛋白质设计。模拟使用了2ms,通过这种方法能够区分成功和不成功的设计,这表明在这个时间尺度上的模拟是有用的。自由能计算以前没有应用于设计的蛋白质。在本案例中,仅使用设计的模型作为输入结构,计算与实验测量的结合自由能相关性较高。说明可以通过使用完全理性的设计标准和“基于物理”的力场来评估复合物,设计对小分子具有高亲和力(Kd<5nM)的蛋白质。
  • 《Nature | 人类序列特异性转录因子的位置依赖性功能》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-07-19
    • 2024年7月17日,华盛顿州立大学等机构的研究人员在Nature发表了题为Position-dependent function of human sequence-specific transcription factors的文章。 转录活动的模式是通过启动子或增强子等调控元件编码到我们的基因组中的,但矛盾的是,这些调控元件包含类似的序列特异性转录因子(TF)结合位点。了解这些序列基调如何编码多个(通常是重叠的)基因表达程序,对于理解基因调控以及非编码DNA突变在疾病中的表现至关重要。 该研究从单个转录起始位点(TSS)的角度研究基因调控,利用自然遗传变异、内源性 TF 蛋白水平的扰动以及对天然和合成调控元件的大规模并行分析,表明 TF 结合对转录起始的影响与位置有关。通过分析 TF 结合位点相对于 TSS 的出现情况,研究人员发现了几个具有高度优先定位的图案。研究人员发现,这些模式是 TF 不同功能特征的组合--许多 TF,包括 NRF1、NFY 和 Sp1 等典型激活因子,会根据它们相对于 TSS 的精确位置激活或抑制转录启动。 因此,TFs 及其间距共同引导着转录启动的位点和频率。更广泛地说,这些发现揭示了类似的TF结合位点如何根据其空间配置产生不同的基因调控结果,以及DNA序列多态性如何导致转录变异和疾病,并强调了TSS数据在解码基因组调控信息中的关键作用。