《细菌合成蛋白质量控制系统》

  • 来源专题:生物科技领域知识集成服务
  • 编译者: 陈方
  • 发布时间:2021-03-08
  • 细菌合成蛋白质量控制系统
    2021年2月5日Nature Chemical Biology报道,韩国首尔国立大学工程学院研究团队开发了一个合成蛋白质质量控制系统(protein quality control,ProQC),可以增强细菌的蛋白质全长翻译能力。
    重组蛋白质已经广泛应用于各种工业领域。蛋白质需要保持全长和适当的三维结构才能发挥功能。但是,由于细菌中的转录和翻译步骤同时发生在同一个地方,截短的基因可以作为核糖体翻译的模板,从而产生不完整的多肽。因此,微生物细胞工厂生产重组蛋白质需要多个蛋白质纯化步骤。
    该研究团队开发的合成蛋白质质量控制系统是一种合成的基因表达盒,限制核糖体只使用完整的mRNA作为模板。真核表达系统翻译过程在转录过程完成后开始,该系统模拟这一过程,当位于mRNA 3’端的顺式触发元件与5’端的Toehold开关杂交,才能暴露核糖体结合位点进行翻译,序列特异性mRNA环化,确保核糖体有效地重新启动。
    研究者将合成蛋白质质量控制系统应用于各种蛋白质表达,全长蛋白质合成增加至2.5倍,而不改变转录或翻译效率。此外,将ProQC系统应用于3-羟基丙酸,通过确保酶在生物合成途径中的全长表达来生产紫胶素和番茄红素,使生化产量提高1.6到2.3倍。
    该基因表达系统可使细菌选择性地翻译完整的mRNA,自行合成高质量的蛋白质。该系统与现有重组蛋白生产策略结合,可以极大地提高微生物重组蛋白和生化生产的效率,在生物制药、工业酶和生物基化学品的领域有广泛应用前景。
    吴晓燕 编译自https://phys.org/news/2021-02-synthetic-protein-quality-bacteria.html
    原文链接:https://www.nature.com/articles/s41589-021-00736-3
    原文标题:Synthetic protein quality control to enhance full-length translation in bacteria

相关报告
  • 《首次在实验室合成由 AI 预测的蛋白质,蛋白质语言模型 ProGen》

    • 来源专题:数智化图书情报
    • 编译者:黄雨馨
    • 发布时间:2023-06-17
    • 人工智能已经将蛋白质工程研究的时间缩短了数年。深度学习语言模型在各种生物技术应用中显示出前景,包括蛋白质设计和工程。 现在,来自 Salesforce Research、Tierra Biosciences 和加州大学的研究团队首次在实验室中合成了由 AI 模型预测的蛋白质,并发现它们与天然对应物一样有效。他们开发出一种名为 ProGen 的蛋白质工程深度学习语言模型。ProGen 接受了来自公开的已测序天然蛋白质数据库中的 2.8 亿个原始蛋白质序列的训练,从头开始生成人工蛋白质序列。最新方法有望用于研制新药。 科学家表示,这项新技术可能比获得诺贝尔奖的蛋白质设计技术定向进化更强大,它将通过加速可用于几乎任何事物的新蛋白质的开发,这些新蛋白质几乎可以用于从治疗到降解塑料的任何领域。从而为已有 50 年历史的蛋白质工程领域注入活力。 该研究以「Large language models generate functional protein sequences across diverse families」为题,于 2023 年 1 月 26 日发布在《Nature Biotechnology》上。 论文链接:https://www.nature.com/articles/s41587-022-01618-2蛋白质工程的传统方法是对天然蛋白质序列进行迭代诱变和选择,以鉴定具有所需功能和结构特性的蛋白质。相比之下,合理或从头设计蛋白质的方法旨在提高创造具有所需特性的新蛋白质的效率和精度。 基于结构的从头设计方法采用基于生物物理原理的模拟,而协同进化方法则从进化序列数据中建立统计模型,以指定具有所需功能或稳定性的新序列。结构和共同进化的方法都有一定的局限性。 最近,深度神经网络已显示出作为蛋白质科学和工程的生成和判别模型的前景。它们学习复杂表示的能力对于有效地利用指数级增长的多样化和相对未注释的蛋白质数据来源可能是至关重要的——公共数据库包含数百万个未对齐的原始蛋白质序列 ProGen:蛋白质语言模型 受到基于深度学习的自然语言模型的成功启发,该研究团队开发了 ProGen,这是一种蛋白质语言模型,在数百万个原始蛋白质序列上训练,可生成跨多个家族和功能的人造蛋白质。 图 1:使用条件语言建模的人工蛋白质生成。(来源:论文)ProGen 通过学习在给定原始序列中过去的氨基酸的情况下,预测下一个氨基酸的概率来迭代优化,没有明确的结构信息或成对协同进化假设。ProGen 以这种无监督的方式从一个大型、多样的蛋白质序列数据库中进行训练,学习了一种通用的、域独立的蛋白质表示,它包含局部和全局结构基序,类似于学习语义和语法规则的自然语言模型。训练后,ProGen 可以提示从头开始为任何蛋白质家族生成全长蛋白质序列,与天然蛋白质具有不同程度的相似性。 ProGen 是一个 12 亿参数的神经网络,使用包含 2.8 亿个蛋白质序列的公开数据集进行训练。ProGen 的一个关键组成部分是条件生成,即由属性标签控制的序列生成作为语言模型的输入提供。在自然语言的情况下,这些控制标签可能是风格、主题、日期和其他实体。对于蛋白质,控制标签是蛋白质家族、生物过程和分子功能等属性,可用于公共蛋白质数据库中的大部分序列。 为了创建模型,科学家们只需将 2.8 亿种不同蛋白质的氨基酸序列输入机器学习模型,让它「消化」信息几周。然后,他们通过使用来自五个溶菌酶家族的 56,000 个序列以及有关这些蛋白质的一些上下文信息来启动模型,从而对模型进行微调。 该模型迅速生成了一百万个序列,研究团队根据它们与天然蛋白质序列的相似程度以及 AI 蛋白质的潜在氨基酸「语法」和「语义」的自然程度,选择了 100 个进行测试。 图 2:生成的人工抗菌蛋白多种多样,在该实验系统中表达良好。(来源:论文)从头开始生成人工蛋白质序列 为了评估功能,通过无细胞蛋白合成和亲和层析来合成和纯化全长基因。在 100 种天然蛋白质的阳性对照集中,72% 的表达良好。ProGen 生成的蛋白质在所有序列同一性箱中与任何已知的天然蛋白质的表达同样好。此外,使用 bmDCA7(一种基于直接耦合分析的统计模型) 设计了人工蛋白质,bmDCA 无法适应五个溶菌酶家族中的三个,并且对其余两个蛋白质家族表现出 60% 的可检测表达(30/50 蛋白质)。这些结果表明,与一批天然蛋白质相比,ProGen 可以生成结构良好折叠的人工蛋白质,即使序列对齐大小和质量限制了替代方法的成功,也能正确表达。 在第一批由 Tierra Biosciences 进行体外筛选的 100 种蛋白质中,该团队制作了五种人工蛋白质以在细胞中进行测试,并将它们的活性与鸡蛋清中发现的一种酶(称为鸡蛋清溶菌酶,HEWL)进行比较。在人类的眼泪、唾液和牛奶中发现了类似的溶菌酶,它们可以抵御细菌和真菌。 图 3:人工蛋白质序列具有功能,同时与任何已知蛋白质的同一性低至 31%,表现出与高度进化的天然蛋白质相当的催化效率,并展示与已知天然折叠相似的结构。(来源:论文)结果表明,ProGen 生成的蛋白质序列不仅可以很好地表达,而且可以维持跨蛋白质家族的不同序列景观的酶功能。 其中两种人工酶能够以与 HEWL 相当的活性分解细菌的细胞壁,但它们的序列彼此只有约 18% 相同。这两个序列与任何已知蛋白质的同一性约为 90% 和 70%。 天然蛋白质中的一个突变就可以使其停止工作,但在另一轮筛选中,研究小组发现,即使只有 31.4% 的序列与任何已知的天然蛋白质相似,AI 生成的酶仍显示出活性。 为了解通用序列数据集和目标蛋白质家族序列对 ProGen 生成能力的相对影响,研究人员使用分支酸变位酶(CM) 和苹果酸脱氢酶(MDH)实验测量的测定数据进行了两项消融研究。 结果表明,训练策略的两个组成部分——对通用序列数据集的初始训练和对感兴趣的蛋白质家族的微调——对最终模型性能有显着贡献。使用包含许多蛋白质家族的通用序列数据集进行训练,使 ProGen 能够学习编码内在生物学特性的通用且可转移的序列表示。对感兴趣的蛋白质家族进行微调可以引导这种表示,以提高局部序列邻域的生成质量。 正在进入蛋白质设计的新时代 Salesforce Research 的研究主管 Nikhil Naik 表示,他们的目标是证明可以利用公开可用的蛋白质数据,将大型语言模型部署到蛋白质设计问题中。「既然我们已经证明 ProGen 有能力产生新的蛋白质,我们已经公开发布了这些模型,以便其他人可以在我们的研究基础上进行构建。」 「开箱即用地从头开始生成功能性蛋白质的能力,表明我们正在进入蛋白质设计的新时代,」该论文的第一作者,Profluent Bio 创始人、Salesforce Research 前研究科学家 Ali Madani 博士说,「这是蛋白质工程师可用的多功能新工具,我们期待看到治疗应用。」 本文中描述的方法的综合代码库可在:https://github.com/salesforce/progen 上公开获得。 参考内容: https://phys.org/news/2023-01-ai-technology-generates-proteins.html https://spectrum.ieee.org/ai-protein-design
  • 《研究人员确定了控制CRISPR系统的分子》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2019-05-05
    • 科学家已经确定了第一种能够抑制和调节CRISPR系统的化合物,这些化合物最终可以使CRISPR基因编辑技术更加精确,高效和安全。为了鉴定这些化合物,研究人员开发了一个新平台,用于快速发现抑制CRISPR酶的小分子。 有时被称为“抗CRISPR”,这样的分子允许研究人员微调CRISPR基因编辑。这些化合物可以防止CRISPR酶无意中影响其他基因 - 具有所谓的“脱靶效应” - 并使实验室和诊所的精确度更高。 由Broad研究所和布莱根妇女医院的研究人员领导的这项工作出现在Cell。 “精确控制和对策是任何强大技术的核心,”资深作者Amit Choudhary说。 “考虑一下我们能够利用诱导手术麻醉的药物,以及适当的控制如何将它们变成非常有用的工具。新兴的CRISPR技术已经开发用于基因治疗和生物技术,同样需要跨多个维度进行控制。“ Choudhary是Broad研究所的副会员,Brigham和妇女医院的副生物学家,以及哈佛医学院的医学助理教授。 FINE-TUNING CRISPR 随着CRISPR技术被开发用于治疗人类疾病,微调CRISPR作用的能力将有助于确保酶在体内其他地方不会产生负面影响。这些抑制剂还可以加速基础生物学研究,为科学家提供一种新的精确工具,可以快速,大规模地回答实验问题。 据研究人员称,CRISPR抑制剂还有助于在实验室环境中控制基因驱动。基于CRISPR的基因驱动是一种分子技术,可以保证生物体将工程基因传递给其所有后代。这个过程导致改变的基因在群体中传播得比自然可能的快得多。可以应用抑制CRISPR酶的分子来抑制这种结果,从而进一步研究基因驱动技术。 与病毒中发现的CRISPR系统的基于蛋白质的抑制剂相比,新鉴定的分子很小且易于逆转,并且更有效地进入细胞。 Choudhary说:“我们正在为化学领域的一小块区域打包。” 抑制CAS酶 为了帮助控制CRISPR的活性,Choudhary及其同事专注于这些酶如何最初识别其基因组靶标。研究人员开发了一系列新的生物化学和细胞测试来测量CRISPR酶与其靶标之间的相互作用,寻找可能干扰这一重要第一步的分子。 为了证明筛选平台的有效性,该团队定制了该技术,以寻找化脓性链球菌(Streptococcus pyogenes)细菌中Cas9酶的抑制剂,这是在CRISPR编辑中最常用的Cas9酶。他们筛选了大约15,000种化合物,以确定Cas9的一系列潜在抑制剂;最佳候选人名为BRD0539。这些分子成功地抑制了人类细胞中天然和工程形式的Cas9。此外,研究人员可以改变其水平以微调抑制程度,或者简单地去除它们,从而重新启用CRISPR活性。 使用相同的实验装置,研究人员已经在识别和开发下一代这些分子。该团队的目标是创建一个可以抑制任何CRISPR系统的化合物工具箱。 Choudhary说:“我们拥有这个平台,我们已经证明了它在概念验证方面的有效性。” “现在我们正在使用它来寻找CRISPR系统的下一个抑制剂。基于化学的方法在基于CRISPR的基因组编辑中的应用才刚刚开始。“ 这项工作部分得到了Burroughs Wellcome Fund,DARPA(Brdi N66001-17-2-4055,HR0011-17-2-0049),NIH(R21AI126239,RM1HG009490,R35 GM118062)和陆军研究办公室(W911NF1610586)的支持。 。 Broad Institute已提交专利申请,包括此处所述的工作。