《中国发布首个海洋天然产物三维结构数据库》

  • 来源专题:中国科学院文献情报系统—海洋科技情报网
  • 编译者: liguiju
  • 发布时间:2018-08-02
  • 原标题:我国发布首个海洋天然产物三维结构数据库 让更多研究成果惠及全球

      近日,在“2018年全球海洋院所领导人会议”上,青岛海洋科学与技术试点国家实验室(以下简称“海洋试点国家实验室”)发布海洋天然产物三维结构数据库,3.1万个海洋天然产物的准确三维结构等重要数据将向全球开放共享。

      海洋是一个巨大的药源宝库,迄今为止,人们已经发现了约3万个结构新颖、活性多样的海洋天然产物。海洋试点国家实验室、青岛海洋生物医药研究院及中国海洋大学等多家单位,联合开发了首个海洋天然产物三维结构数据库,该数据库约含有3.1万个海洋天然产物的准确三维结构,可直接用于虚拟筛选与智能药物设计。

      “打造‘蓝色药库’是人类的共同事业,需要国际社会共同参与。我们开放数据库,希望为人类的健康事业造福。”海洋试点国家实验室学术委员会主任、中国工程院院士管华诗表示,这个三维结构数据库是“蓝色药库”的基础数据库,将会提升海洋药物开发的速度与效率。

      据海洋试点国家实验室海洋创新药物筛选与评价平台主任杨金波介绍,全球范围内海洋药物研究遇到的主要问题就是资源获取问题,如何从数万个天然产物中筛选、开发新药是构建“蓝色药库”的关键。经过两年的时间,海洋试点国家实验室联合美国、英国、法国、澳大利亚等国家的18个团队、100多名专家协同攻关,通过从海洋微生物、矿物、动物当中提取天然产物,构建了精确的三维结构数据库。目前,海洋试点国家实验室已经完成170余个美国FDA批准的肿瘤药物靶点对海洋化合物数据库的精确筛选,发现1000余个具有开发前景的抗肿瘤药物苗头分子,经过有机合成、生物实测、药理药效分析和临床前试验,发现了诸多可开发为海洋药物的先导化合物,海洋药物筛选准确率由20%以下跃升到70%以上。

      海洋试点国家实验室高性能科学计算与系统仿真平台主任魏志强表示,海洋天然产物三维结构数据库的发布体现出几个方面的交叉。第一是平台的交叉。海洋试点国家实验室两个重要的平台——新药筛选平台、超算平台的交叉融合使得三维数据库的建设有了可能。第二个交叉是学科的交叉,药物的研发设计和信息领域的超级计算机的交叉。原来传统的一款新药的研发周期大概要10到15年,成本要10亿美元到15亿美元,通过超算则可以大大降低成本、缩短周期。这些交叉融合也是海洋试点国家实验室平台型效应的集中体现

  • 原文来源:;http://www.hellosea.net/news/focus/2018-07-31/52212.html
相关报告
  • 《中国科学院海洋研究所发布国际首套全球大洋海水三维pH格点数据集》

    • 来源专题:中国科学院文献情报系统—海洋科技情报网
    • 编译者:熊萍
    • 发布时间:2025-03-24
    • 近日,中国科学院海洋研究所宋金明团队在《Earth System Science Data》期刊发表了国际首套基于机器学习的月平均全球大洋海水三维pH格点数据集,该数据集具有全球大洋1°×1°分辨率,覆盖大洋0~2000米(41层),时间跨度为1992年至2020年。 海洋持续吸收大气CO2导致的海水酸化作为当前海洋面临的主要环境问题之一而备受关注。海洋酸化会对海洋生物和生态环境产生系统影响,导致海洋生态系统发生显著变化,准确评估海洋酸化状况对于探究海洋生物对海水pH变化的响应和全球海洋吸收二氧化碳能力的未来变化至关重要。然而,目前观测数据的不均衡严重限制了人们对全球大洋酸化的了解,特别是缺乏表层海水以下长期、连续和高覆盖率的海水pH数据。为了更加准确地评估全球大洋酸化状况,宋金明研究团队采用了逐步前反馈神经网络算法(Stepwise FFNN),基于全球海洋数据分析计划(GLODAP)观测数据构建海水pH与环境参数间的非线性关系,获得了近30年来的月平均全球大洋海水三维pH格点数据集。 相比国际上目前仅限于表层海水的pH同类产品,该研究获取的pH格点数据集将海水深度扩展到2000米,技术层面存在的优势包括:1)根据pH变化和影响因素将全球大洋进行分区,在不同的区域用逐步前反馈算法来筛选和pH最相关的环境参数,使用的输入参数更能反映pH影响因素的区域差异,显著提高了格点数据集的区域准确度。2)利用观测数据基于交叉边界的分区最优插值,可更准确地构建格点数据集,这种方法与以往国内外海洋化学参数格点数据构建相比体现出了显著的优势。3)使用年际交叉验证法和定点连续观测站的独立验证,更好地避免了神经网络模型过拟合及其对数据准确性评估的影响,可更加合理地评估和验证pH格点数据的准确性。 该格点数据集扩展了对大洋不同深度酸化状况以及进程的系统认识,对探究海洋酸化的生态环境效应乃至全球变化响应意义重大。 海洋研究所钟国荣特别研究助理为论文第一作者,宋金明和李学刚为论文共同通讯作者,王凡、张斌、王彦俊等为共同作者。研究得到了国家自然科学基金、国家重点研发计划、崂山实验室项目等课题资助。 pH格点数据集面向全球公开共享,可以通过中国科学院海洋科学数据中心网站(http://dx.doi.org/10.12157/IOCAS.20230720.001)免费获取。 相关论文: Zhong, G., Li, X., Song, J., Qu, B., Wang, F., Wang, Y., Zhang, B., Cheng, L., Ma, J., Yuan, H., Duan, L., Li, N., Wang, Q., Xing, J., and Dai, J.: A global monthly 3D field of seawater pH over 3 decades: a machine learning approach, Earth Syst. Sci. Data, 17, 719–740, https://doi.org/10.5194/essd-17-719-2025, 2025.
  • 《研究发布大豆多维组学数据库SoyOmics》

    • 来源专题:生物育种
    • 编译者:姜丽华
    • 发布时间:2023-04-09
    •  大豆(Glycine max (L.) Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大豆遗传育种提供有力支持。   近日,中国科学院遗传与发育生物学研究所田志喜团队联合北京基因组研究所(国家生物信息中心)章张、宋述慧团队,开发了大豆多维组学深度整合数据库SoyOmics。相关研究成果以SoyOmics: A deeply integrated database on soybean multi-omics为题,发表在《分子植物》(Molecular Plant)上。   SoyOmics数据库全面整合分析了大豆相关的多维组学数据。数据库目前收录了27个大豆品系的从头组装基因组数据,并对相应基因组信息进行了全面的基因组注释。该数据库以高质量的ZH13作为参考基因组,对2898份材料的全基因组测序数据进行了全基因组序列变异检测,鉴定到约3800万条SNP/INDEL变异数据,同时为每个变异位点提供多层次注释信息。除序列变异外,数据库提供了来自大豆泛基因组分析的约55万条结构变异数据以及基于结构变异构建的图泛基因组。数据库收录了来自ZH13和Williams82两个基因组27个组织时期的表达数据以及其他26个品系9个组织时期的表达数据,并展示了不同品系间同源基因的差异表达。数据库针对115个表型多年多点测定的约2.7万条表型记录进行了本体注释和归类,并将表型数据与变异数据进行关联。除以上组学数据外,数据库同时提供了部分种质资源的甲基化测序数据以及Soy40K大豆芯片数据。该数据库从基因组、变异组、转录组、表型组等不同层面整合了大豆相关数据集,实现了不同层次组学数据的交互查询和联合比较分析。   为更好服务于用户,研究团队开发了多个实用的“一站式”分析模块,支撑实现GWAS分析、表达模式分析、单倍型分析、基因组坐标转换、图泛基因组可视化等。该数据库具备多维组学数据间的深度关联性、用户的高度可交互性及分析场景的高覆盖性,预期能为大豆遗传学及育种研究提供基础数据支撑和全新的观察视角。   研究工作得到中国科学院战略性先导科技专项、科技创新2030-重大项目、国家自然科学基金、国家重点研发计划、博士后创新人才计划等的支持。