研究发布大豆多维组学数据库SoyOmics

《研究发布大豆多维组学数据库SoyOmics》

来源专题：生物育种
编译者： 姜丽华
发布时间：2023-04-09
大豆（Glycine max (L.) Merr.）是重要的粮油作物之一，其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析，将会为大豆遗传育种提供有力支持。

近日，中国科学院遗传与发育生物学研究所田志喜团队联合北京基因组研究所（国家生物信息中心）章张、宋述慧团队，开发了大豆多维组学深度整合数据库SoyOmics。相关研究成果以SoyOmics: A deeply integrated database on soybean multi-omics为题，发表在《分子植物》（Molecular Plant）上。

SoyOmics数据库全面整合分析了大豆相关的多维组学数据。数据库目前收录了27个大豆品系的从头组装基因组数据，并对相应基因组信息进行了全面的基因组注释。该数据库以高质量的ZH13作为参考基因组，对2898份材料的全基因组测序数据进行了全基因组序列变异检测，鉴定到约3800万条SNP/INDEL变异数据，同时为每个变异位点提供多层次注释信息。除序列变异外，数据库提供了来自大豆泛基因组分析的约55万条结构变异数据以及基于结构变异构建的图泛基因组。数据库收录了来自ZH13和Williams82两个基因组27个组织时期的表达数据以及其他26个品系9个组织时期的表达数据，并展示了不同品系间同源基因的差异表达。数据库针对115个表型多年多点测定的约2.7万条表型记录进行了本体注释和归类，并将表型数据与变异数据进行关联。除以上组学数据外，数据库同时提供了部分种质资源的甲基化测序数据以及Soy40K大豆芯片数据。该数据库从基因组、变异组、转录组、表型组等不同层面整合了大豆相关数据集，实现了不同层次组学数据的交互查询和联合比较分析。

为更好服务于用户，研究团队开发了多个实用的“一站式”分析模块，支撑实现GWAS分析、表达模式分析、单倍型分析、基因组坐标转换、图泛基因组可视化等。该数据库具备多维组学数据间的深度关联性、用户的高度可交互性及分析场景的高覆盖性，预期能为大豆遗传学及育种研究提供基础数据支撑和全新的观察视角。

研究工作得到中国科学院战略性先导科技专项、科技创新2030-重大项目、国家自然科学基金、国家重点研发计划、博士后创新人才计划等的支持。

展开更多
原文来源：https://www.cas.cn/syky/202304/t20230405_4883137.shtml

276浏览量

0点赞

原文链接

相关报告

《中国科研团队发布全转录组关联研究知识库》
- 来源专题：生物安全
- 编译者：闫亚飞
- 发布时间：2022-11-28
- 据生物谷网11月3日消息，中国科学院与中国医学科学院的研究团队开发的全转录组关联研究（TWAS Atlas）知识库正式上线，可为用户提供多渠道的数据浏览、检索和下载等功能。TWAS Atlas 1.0版本共计整合来自200篇TWAS研究的分析数据，经人工审编获得401266条高质量的人类基因-性状关联条目，涉及257种性状，22247个基因及135种组织类型，并收集相关元数据和注释信息。此外，该系统通过整合基因-性状关联信息与GTEx数据库的SNP-基因关联信息，从头构建了综合性的交互式SNP-基因-性状关联知识图谱，实现了多疾病、多组织、多组学层次关联调控关系的在线解析和可视化，可为相关研究人员的基因-性状关联知识的创建和挖掘等个性化研究提供重要参考。相关研究成果发表于Nucleic Acids Research期刊。
  
  展开更多
140浏览量

0点赞

收藏

原文链接
《中国大豆“中黄13”基因组发布》
- 来源专题：生物安全知识资源中心 | 领域情报网
- 编译者：hujm
- 发布时间：2018-08-03
- 中国科学院遗传与发育生物学研究所联合中国科技大学、江苏省农业科学院种质资源与生物技术所、北京贝瑞和康生物技术有限公司等，对中国国审大豆品种“中黄13”（Gmax_ZH13）的基因组进行从头组装，最终得到1.025 Gb的基因组序列，包含20条染色体和1条叶绿体。相关成果近日以封面文章形式在线发表于《科学中国—生命科学》。大豆起源于中国，古称“菽”，约在5000年前由其野生种驯化而来，随后广泛传播于世界各地。大豆在引种和改良过程中产生了遗传瓶颈效应，使来自不同主产区的大豆品种间具有显着的遗传变异。目前广泛采用的大豆参考基因组来源于美国品种“Williams 82”。该单一品种的基因组并不能完全代表所有大豆的遗传变异，特别是和美国地理距离遥远具有明显遗传变异的亚洲品种。此外，功能研究发现该基因组存在多处组装错误，影响了功能基因的定位挖掘。合作团队综合运用单分子实时测序、单分子光学图谱和高通量染色体构象捕获技术，分析得出“中黄13”基因组Contig N50为3.46 Mb，Scaffold N50为51.87 Mb，是目前连续性最好的植物基因组之一。进一步分析，Gmax_ZH13和Williams 82基因组之间存在着大量的遗传变异，包括1404个易位事件、161个倒位事件、1233个倒位易位事件，以及在Gmax_ZH13中出现的505506个小插入/缺失和17409个大插入/缺失。该研究整合大量转录组数据为Gmax_ZH13基因注释基因构建了一个完整的基因共表达网络，得到26个可能控制大豆开花时间的基因，并利用自然群体遗传变异和表型差异的关联对其中部分基因进行验证，为重要农艺性状基因的挖掘提供了新思路。Gmax_ZH13基因组的发表为大豆基础研究提供了重要资源，为国产优异大豆品种的培育奠定了基础。
  
  展开更多
740浏览量

0点赞

收藏

原文链接

《研究发布大豆多维组学数据库SoyOmics》

《中国科研团队发布全转录组关联研究知识库》

《中国大豆“中黄13”基因组发布》