《农业资源研究中心在功能蛋白自然多样性挖掘方法方面取得进展》

  • 来源专题:转基因生物新品种培育
  • 编译者: 姜丽华
  • 发布时间:2022-10-31
  •      构成蛋白质分子的氨基酸种类、数目以及排列顺序决定了蛋白质的多样性。而数百万年、数十亿年的自然选择过程形成了蛋白质的自然多样性。目前已知的功能蛋白质仅仅代表了自然界中蛋白质的一小部分。完整地复原功能蛋白质的自然多样性,不仅可以为探究天然蛋白质的进化过程奠定基础,还可以为蛋白质工程改造提供大规模数据库。然而传统的环境宏基因组方法,如压力筛选阳性克隆或通过设计引物从宏基因组中克隆目标基因,都不能大量获得自然界特定家族未知蛋白。近日,中国科学院遗传与发育生物学研究所农业资源研究中心研究员李小方团队,通过基于序列的宏基因组学和功能基因组学技术,从全球不同生境挖掘到大量新颖铜抗性copA功能基因。该研究以Sequence-based Functional Metagenomics Reveals Novel Natural Diversity of Functioning CopA in Environmental Microbiomes为题发表在Genomics, Proteomics & Bioinformatics上。

      蛋白质自然多样性的概念在进化生物学的研究以及蛋白质工程改造中起着至关重要的作用。例如,研究者广泛利用DNA定向RNA聚合酶β亚基(RpoB)和固氮酶铁蛋白(NifH)的自然多样性来研究微生物的系统发育,特别是那些不可以人工培养的微生物。在这项研究中,研究团队开发了基于序列的功能宏基因组学流程,通过结合宏基因组组装、本地BLAST、进化踪迹分析、化学合成以及传统功能基因组学技术,挖掘了全球微生物宏基因组数据中的铜抗性基因copA的多样性。此研究共收集了来自世界各地的87个宏基因组数据,从数亿蛋白序列中筛查到近100000条候选序列,进一步手工筛查获得175个高置信新颖copA基因序列。系统发育分析表明,几乎所有预测到的CopA蛋白都与已知CopA蛋白有近缘关系,其中55个序列来自完全未知的物种。通过化学合成10个预测copA基因和3个已知copA基因并转化铜敏感大肠杆菌,研究发现其中5个预测copA基因不仅提高了宿主的铜抗性,同时促进了宿主对铜的吸收。该研究不仅扩展了人们对环境微生物CopA功能多样性的认识,也为基因工程修复生物材料的开发提供了宝贵的基因资源。

      相关研究工作得到国家自然科学基金面上项目和青年科学基金项目、河北自然科学基金杰出青年项目、国家重点研发计划项目的资助。


  • 原文来源:http://www.cas.ac.cn/syky/202209/t20220921_4848349.shtml
相关报告
  • 《【中国农业大学食品科学与营养工程学院】薛勇副教授利用机器学习和虚拟水解技术在挖掘DPP-4抑制肽方面取得新进展》

    • 来源专题:食品安全与健康
    • 编译者:王晓梅
    • 发布时间:2024-07-09
    • 2024年5月,食品科学与营养工程学院国家果蔬加工工程技术研究中心沈群、薛勇课题组在中国科协和美国科学促进会合作期刊《Research》发表研究性论文 “Mining Bovine Milk Proteins for DPP-4 Inhibitory Peptides using Machine Learning and Virtual Proteolysis”,文章基于人工智能和虚拟水解技术开发了一种从已知蛋白质序列中精准挖掘功能性活性肽的策略。 目前,制备纯度高、结构清晰、功能明确的生物活性肽十分困难。已知结构的功能肽虽然能够人工合成,但价格昂贵、耗时耗力,在功能性食品中大规模应用难度较大。传统的食源性功能肽的研究方法包括蛋白酶水解、功能评价、分离纯化、结构鉴定、虚拟筛选和功能验证等,虽然能够发现一些潜在的功能肽,但是由于水解体系的复杂性,难以实现对水解肽功能性的充分挖掘和表征,也难以建立稳定的、可靠的构效关系,导致产业化和市场应用过程中食源性功能肽存在功效不稳定、不明确的问题。随着蛋白质分离技术的发展,越来越多的食源性蛋白质已实现充分分离和纯化,同时氨基酸序列得到明确的解析。针对已知序列的蛋白质,基于虚拟水解技术可获取不同蛋白酶水解产生的多肽,结合人工智能技术建立的多肽序列和功能的构效关系,可快速实现食源性功能肽的高通量挖掘,继而快速明确酶解条件和所需蛋白质资源,为规模化制备特定功能肽提供理论依据。 本研究开发了结合机器学习和虚拟蛋白水解技术的 DPP-4 抑制肽发现和验证的综合策略。 本研究训练了 GBDT、XGBoost、LightGBM、CatBoost 和 RF 五种机器学习模型,其中LightGBM 表现出卓越的性能,AUC值为0.92 ± 0.01。随后,采用 LightGBM 来预测通过虚拟水解乳蛋白产生肽的DPP-4抑制潜力。通过一系列的计算机筛选过程和体外实验,发现GPVRGPF和HPHPHL表现出良好的DPP-4抑制活性。分子对接和分子动力学模拟进一步证实了这些肽的抑制机制。通过追溯虚拟蛋白步骤,发现GPVRGPF可以通过胰凝乳蛋白酶对β-酪蛋白的酶解获得,而HPHPHL可以通过菠萝蛋白酶或木瓜蛋白酶对κ-酪蛋白的酶解获得。这种创新方法不仅节省了生物活性肽发现的成本和时间,并且有助于初步确定关键水解参数,有利于工业化过程中生物活性肽的高效制备。
  • 《农业资源中心在冬小麦抗旱品种鉴选指标和方法研究方面获进展》

    • 来源专题:生物育种
    • 编译者:季雪婧
    • 发布时间:2024-10-28
    •     冬小麦是重要的粮食作物之一。然而,气候变化导致世界范围冬小麦主产区变得更加干旱。抗旱作物品种的选育是应对干旱对作物生产影响的重要措施。提升作物抗旱性需要维持作物在有限供水下的生存和繁殖能力,更需要提升其收获籽粒产量的能力。针对大量遗传育种材料和品种,获取不同供水条件下的籽粒产量周期长、投入大,并受到年际生长环境变化影响。找到简单、准确、快速预测作物品种抗旱性的方法,能够提高作物抗旱品种选育的效率。     中国科学院遗传与发育生物学研究所农业资源研究中心张喜英团队在2016年至2021年的5个冬小麦生育期,在中国科学院栾城农业生态系统试验站对10个冬小麦品种在严重缺水、中度缺水和正常供水3个供水水平下进行田间试验,并进行3个生长期的苗期温室控制试验,比较品种抗旱性鉴定结果。     研究显示,在田间生长条件下,品种的抗旱节水特征受年型影响。通过单一指数或基于单个季节结果筛选的抗旱性存在差异。研究基于7个指标进行主成分分析和分级聚类分析,将10个品种分为4种干旱响应类型。籽粒产量水平田间生长条件下的抗旱性分类,与温室苗期生长条件下生物量抗旱分类高度一致。冬小麦品种在不同供水条件下的苗期生物量,可用于预测田间种植条件下的最终品种产量表现和水分利用特征。精确控制的温室盆栽试验可以放大不同小麦品种的用水特性以进行评估。气孔调控能力强的品种具有较高的抗旱性和生物量产量。在田间生长条件下,冠层温度较低、根系生长较深、根/冠比高、水分胁迫下气孔导度维持能力强,与作物品种抗旱性呈正相关关系。上述成果为不同生长条件下抗旱冬小麦品种的鉴选提供了参考方法和指标。     相关研究成果以Water use characteristics and drought tolerant ability of different winter wheat cultivars assessed under whole growth circle and at seedling stage为题,在线发表在Agricultural Water Management上。研究工作得到国家重点研发计划和河北省相关项目的支持。