《遗传所破译模式植物金鱼草基因组》

  • 来源专题:生物科技领域知识集成服务
  • 编译者: 陈方
  • 发布时间:2020-04-08
  • 金鱼草(Antirrhinum majus L.)也称龙头花(snapdragon),一直作为分子和发育遗传学的模式作物,很多关键基因是在金鱼草中被首次发现。金鱼草中内在活跃的转座子促进了基因的分离和分析。但是,迄今为止,这些研究都是在缺少基因组序列条件下进行的,无法研究这些基因、转座子和性状的整体进化和遗传结构。
    中国科学院遗传与发育生物学研究所薛勇彪研究组联合梁承志研究组、John Innes中心Enrico Coen研究组和华大基因等研究团队,利用第二代Illumina基因组测序平台和第三代PacBio单分子测序技术,结合遗传图谱辅助组装策略,完成了对栽培金鱼草(Antirrhinum majus cv. JI7)的全基因组序列测定。该研究结果于2019年1月29日在线发表在《自然-植物》期刊。
    该研究得到了金鱼草8条染色体的分子序列510Mb,覆盖度为97.12%,注释了37714个蛋白编码基因,报告了一个近乎完整的金鱼草基因组。通过对序列的比较分析显示,车前科与茄科在大约六千二百万年前从其最近的祖先处分开并在大约四千六百万到四千九百万年前发生了全基因组复制事件,该全基因组复制对金鱼草中与花不对称性相关的TCP基因家族进化具有重要贡献。此外,该研究发现金鱼草的假S位点(ψS-locus)在大约2Mb的序列上含有102个基因,其中包含37个SLF基因但缺失S-RNase,提示该花柱因子的丢失是栽培金鱼草获得自交亲和性状的主要原因,并发现栽培金鱼草S-位点与野生金鱼草S-位点之间具有高度的共线性。综上,金鱼草基因组的破译将极大加速这个模式生物的基因组学和进化研究。

相关报告
  • 《AI 破译植物 DNA:语言模型将改变基因组学和农业》

    • 来源专题:农机装备
    • 编译者:江浩
    • 发布时间:2025-06-03
    • 信用:作者图 3 基因组序列和语言序列之间的相似性。Newswise — 通过利用基因组序列和自然语言之间的结构相似性,这些 AI 驱动的模型可以解码复杂的遗传信息,从而为植物生物学提供前所未有的见解。面对全球挑战,这一进步有望加速作物改良、加强生物多样性保护和加强粮食安全。 传统上,植物基因组学一直在努力解决庞大而复杂的数据集的复杂性,这些数据集通常受到传统机器学习模型的特殊性和注释数据的稀缺性的限制。虽然 LLM 已经彻底改变了自然语言处理等领域,但它们在植物基因组学中的应用仍处于起步阶段。主要障碍是调整这些模型来解释植物基因组的独特“语言”,这与人类的语言模式有很大不同。本研究解决了这一差距,探索了如何定制 LLM 以有效地理解和预测植物遗传功能。 海南大学邹美玲、柴海伟和夏志强团队于 2025 年 4 月 14 日发表在《热带植物》上的一项研究 (DOI: 10.48130/tp-0025-0008) 详细介绍了 LLM 在基于大量植物基因组数据进行训练时如何准确预测基因功能和调控元件。 在这项研究中,研究人员探索了 LLM 在植物基因组学中的潜力。通过在自然语言和基因组序列的结构之间进行相似之处,该研究强调了如何训练 LLM 来理解和预测植物中的基因功能、调节元件和表达模式。该研究讨论了各种 LLM 架构,包括仅编码器模型(如 DNABERT)、仅解码器模型(如 DNAGPT)和编码器-解码器模型(如 ENBED)。该团队采用了一种方法,该方法涉及在植物基因组序列的大量数据集上对 LLM 进行预训练,然后使用特定的注释数据进行微调以提高准确性。通过像处理语言句子一样处理 DNA 序列,这些模型可以识别遗传密码中的模式和关系。这些模型在启动子预测、增强子鉴定和基因表达分析等任务中显示出前景。值得注意的是,已经开发了 AgroNT 和 FloraBERT 等植物特异性模型,在注释植物基因组和预测组织特异性基因表达方面表现出更好的性能。然而,该研究还指出,大多数现有的 LLM 都是在动物或微生物数据上训练的,这些数据通常缺乏全面的基因组注释,展示了 LLM 在不同植物物种中的多功能性和稳健性。为了解决这个问题,作者主张开发以植物为重点的 LLM,这些 LLM 在各种植物基因组数据集上进行训练,包括来自热带植物等代表性不足的物种的数据集。他们还强调了整合多组学数据和开发标准化基准以评估模型性能的重要性。 总之,这项研究强调了将人工智能,特别是大型语言模型,整合到植物基因组学研究中的巨大潜力。通过弥合计算语言学和遗传分析之间的差距,LLM 可以彻底改变我们对植物生物学的理解,为农业、保护和生物技术的创新铺平道路。未来的研究将侧重于改进这些模型,扩展其训练数据集,并探索它们在实际农业场景中的应用,以充分利用其功能。 ### 引用 数字对象标识符 编号:10.48130/TP-0025-0008 原始源 URL https://doi.org/10.48130/tp-0025-0008 关于热带植物 《热带植物》(E-ISSN 2833-9851)是海南大学的官方期刊,由最大学术出版社出版。《热带植物》经过严格的同行评审,并以开放获取的形式出版,以便快速传播研究成果,促进学术知识交流,并鼓励就热带植物研究中出现的创新技术和问题进行学术讨论。 资金信息 该研究得到了生物育种-国家科技重大专项(2023ZD04073)、三亚崖湾科技城项目(SCKJ-JYRC-2022-57)和YZBSTCACC高性能计算平台的支持。期刊链接:热带植物,2025 年 4 月请求专家
  • 《遗传所植物基因编辑研究取得新成果》

    • 来源专题:生物科技领域知识集成服务
    • 编译者:陈方
    • 发布时间:2020-09-10
    • 2018年10月1日,中国科学院遗传与发育生物学研究所连发两篇《自然-生物技术》文章,分别运用基因编辑技术精准靶向多个产量和品质性状控制基因的编码区及调控区,加速了野生植物的人工驯化;以及构建新的单碱基编辑系统A3A-PBE,成功在小麦、水稻及马铃薯中实现高效的C-T单碱基编辑。 在第一篇文章中,中国科学院许操研究组和高彩霞研究组合作,选用天然耐盐碱和抗细菌疮痂病的野生醋栗番茄(Solanum pimpinellifolium) 为基础材料,运用基因编辑技术精准靶向多个产量和品质性状控制基因的编码区及调控区,在不牺牲其对盐碱和疮痂病天然抗性的前提下,将产量和品质性状精准地导入了野生番茄,加速了野生植物的人工驯化。这一研究首次通过基因编辑实现野生植物的快速驯化,为精准设计和创造全新作物提供了新的策略。 第二篇文章中,高彩霞研究组在前期研究基础上利用Cas9变体(nCas9-D10A)融合人类胞嘧啶脱氨酶APOBEC3A(A3A)和尿嘧啶糖基化酶(UGI),构成新的单碱基编辑系统A3A-PBE,成功在小麦、水稻及马铃薯中实现高效的C-T单碱基编辑。利用此技术体系,通过基因枪瞬时转化对小麦抗除草剂基因TaALS和对单倍体诱导基因TaMTL进行编辑,效率分别达到22.5%和16.7%,且TaALS突变体对除草剂表现出显著的抗性;通过农杆菌转化法在水稻中的编辑效率高达82.9%。此外,A3A-PBE可对马铃薯内源基因进行高效编辑。A3A-PBE碱基编辑系统具有高效、宽脱氨化窗口及对靶标C上文无序列偏好性等优势,可拓宽植物单碱基编辑的范围。 该体系的建立对实现植物基因组大规模体内饱和突变,研究植物基因功能及基因调控元件作用等具有重要的技术支撑意义。 吴晓燕 摘编自http://www.ebiotrade.com/newsf/2018-10/20181010121804450.htm 原文标题:两篇Nature Biotechnology发布中国科学院基因编辑研究新成果