《昆明植物所王学文博士完成新款基因组DNA微卫星序列软件的研发》

  • 来源专题:转基因技术
  • 编译者: dingqian
  • 发布时间:2016-09-14
  • SSR又称为微卫星序列,是一种由几个核酸为重复单位的DNA序列,广泛分布于动植物DNA种, 在种内和种间群的遗传中具有多样性,因此广泛应用于DNA的barcoding,SSR分子标记开发,分子育种,物种资源与个体鉴定。随着越来越多的基因组序列和转录组序列的产生,海量DNA序列的应用与开发成了一个关键的瓶颈。

    中国科学院昆明植物所王学文博士与国家公安部物证中心共同自主研发了一款新的DNA序列中SSR分析和应用的软件,名字为GMATA (Genome-wide Microsatellite Analyzing Tool Package)。该软件具有五大功能:(1)SSR序列发掘,(2)统计分析,(3)统计图形,(4)分子标记设计与多态性分析,(5)SSR及分析标记在基因组中整合及图形化显示 。GMATA采用了全新的策略与算法,主要解决了大基因组数据中SSR分析与应用困难的问题,提供了一站式的DNA序列中SSR分析和SSR分子标记应用设计的解决方案 。

    与已有的同类软件相比,GMATA是目前运行速度最快,功能最多的软件;首次提供5个层次的SSR统计分析与高分辨率的统计图形的生成;在Windows, 或者Mac OS,或者Linux平台运行,一台普通电脑就可以分析任何大小的DNA序列中SSR;具有多种友好可选运行界面,用户只需要点击鼠标或者输入命令;首次将SSR、SSR分子标记与全基因组序列、基因功能等数据图形化整合显示。GMATA是基因组大数据中SSR分析与分子标记开发的理想工具 。下载地址:http://sourceforge.net/projects/gmata/?source= navbar

    研究人员使用本软件,对主要禾本科粮食作物例如小麦与水稻等15个全基因组序列和转录组序列进行分析,首次发现了禾本科中SSR分布的新规律。结果表明,以前对禾本科植物中的SSR的理解只适合小部分基因组;而绝大部分禾本科中的真正的规律为:最主要的SSR motif为二核苷酸单元的GA/TC,接着是A/T单元,然后再是GCG/CGC单元。禾本科含有丰富的G/C,但是最丰富的SSR却不是G/C。这些信息对分子标记的开发和应用选择具有重要指导意义。 此外,本研究还对五大类烟草的大基因组中的SSR分子标记进行开发 ,验证了本软件的应用前景。

  • 原文来源:http://journal.frontiersin.org/article/10.3389/fpls.2016.01350/full
相关报告
  • 《昆明植物所揭示亚基因组在竹子进化中的作用》

    • 来源专题:生物育种
    • 编译者:季雪婧
    • 发布时间:2024-04-26
    •     多倍化(基因组加倍)作为进化的主要驱动力,在开花植物进化树的不同阶段普遍存在。然而,人们对多倍化细胞核中亲本基因组之间的相互作用还知之甚少,这通常涉及到亚基因组的优势。竹子在物种和形态上表现出很大的多样性,包括一个以二倍体为主的草本分支(约126种)和三个主要的多倍体木本分支(约1576种)。木本竹类是适应森林栖息地的重要植物品系之一,具有快速生长和同步开花等生物学特性。     中国科学院昆明植物研究所李德铢研究员领导的团队近日与美国科学家合作,提出了木本竹类起源和多倍化的精细模型。这篇题为“Genome assemblies of 11 bamboo species highlight diversification induced by dynamic subgenome dominance”的论文于3月15日发表在《Nature Genetics》杂志上。研究人员发现,在竹子进化的早期,木本品系的二倍体祖先之间反复发生杂交事件,随后出现多倍化,同时在木本品系和草本品系之间发生基因渐渗现象。李德铢团队长期以来一直致力于竹子的系统和进化研究。在之前报告四种竹子的基因组草图的工作中,他们提出了木本竹类的杂交和多倍化网状演化路线。为了覆盖不同的倍性水平和系统发育多样性,研究团队选择了11个代表性物种进行基因组测序:两种草本竹子和九种木本竹子,涵盖三个分支:温带木本分支、新热带木本分支和旧热带木本分支。在中国西南野生物种种质资源库的支持下,他们采用三代测序技术成功获得了11个竹子物种的染色体级别的基因组序列。他们收集并测序了476份竹子样本的转录组数据,这些样本覆盖不同的组织和不同的生长阶段。利用多组学方法,研究小组证实了木本竹类存在四套不同的亚基因组:A、B、C和D。     进一步的研究表明,尽管三次多倍化事件集中在2100万年前至1200万年前,但木本竹类却表现出显著的核型稳定性,在亚基因组层面维持了禾本科祖先状态的12条染色体。研究表明,C亚基因组在两个四倍体分支中具有明显的优势,这反映在一系列的特征上,包括基因组大小、基因分离、基因组重排、转座元件和基因表达。然而,在六倍体分支中,亚基因组优势则表现得更为动态,呈现从C亚基因组到A亚基因组过渡的趋势。进一步分析表明,优势的C亚基因组以及六倍体分支中的A亚基因组对木本竹类独特性状的进化贡献最大,或催生了它们的适应性演化,使其在森林栖息地中成功繁衍。这项工作强调了使用各个分支的基因组序列组装的实用性,可促进我们对多倍体植物亚基因组进化的理解。
  • 《军事医学科学院完成寨卡病毒全基因组序列测定》

    • 来源专题:新发突发疾病防治
    • 编译者:张玢
    • 发布时间:2016-02-23
    • 新华社北京2月23日电(胥金章、沈基飞)记者23日从军事医学科学院获悉,春节期间,我国广东省出现寨卡病毒输入性感染病例后,军事医学科学院微生物流行病研究所迅即启动应急工作机制,与广州市第八人民医院、出入境检验检疫系统相关单位密切合作,在获得从委内瑞拉归国患者临床标本后,采用高通量测序技术,于2月21日直接从尿液中获得病毒全基因组序列。 据介绍,这是全球首次直接从患者尿液中获得病毒全基因组序列。这一病毒基因组全长10.8kb,系统进化分析表明,属于亚洲世系,与巴西、苏里南、波多黎各等美洲国家流行毒株同源性为99.7%;核苷酸序列比对发现20个突变位点,其中5个突变位点导致氨基酸改变。 寨卡病毒全基因组序列的获得,为病毒的溯源和进化提供了重要证据,可用于指导诊断试剂、疫苗和药物的研发,使我国在全球寨卡疫情防控中占得先机。同时,直接从患者尿液获取病毒全基因组序列,解决了复杂临床样品中病原体高通量测序的技术难题,为临床诊疗方案和出院标准的优化提供了科学依据。 寨卡(Zika)病毒属于黄病毒属黄病毒科,是一种主要由伊蚊传播的虫媒病毒。1947年首次在乌干达寨卡丛林中的恒河猴体内分离出这一病毒,全长基因组序列在2007年被测出。虽然目前还没有输血传播病例发生,但已经在个别供血者血样中检测到寨卡病毒RNA,他们是无症状的寨卡病毒感染者。感染寨卡病毒的人群中通常仅有20%的人发病,潜伏期为3至12天。寨卡病毒流行的地理分布、临床表现与登革热、基孔肯雅热十分相近,且均为蚊虫叮咬传播,因此很容易造成误诊。 2015年5月以来,美洲中南部国家暴发流行寨卡病毒病疫情,呈现蔓延扩大和跨境传播趋势。2015年12月1日,世界卫生组织、泛美卫生组织共同发布了关于寨卡病毒的全球警告。