《代谢组学的标准协调(COSMOS):促进代谢组学数据访问》

  • 来源专题:食物与营养
  • 编译者: lixiaoman
  • 发布时间:2016-05-30
  • 在一系列的研究领域中,代谢组学已经成为包括医学在内的生命科学、生物技术、环境科学的一个重要分型技术。这样就需要研究组实验之间的信息传递,以及发现潜在的出版商和资助者。在代谢组学的标准计划的初步努力下,在最终的报告中提出了包括代谢组学数据库在内的概念。通过社区的建立,存储、交换、比较等仍然是代谢组学的标准和基础设施,以保证代谢组学数据的再利用。代谢组学的标准框架方案 (COSMOS) 是发展一个强大的数据基础设施和代谢组学数据和元数据交换标准。这是支持工作范围内广泛的代谢组学应用以及在欧洲的社区和更广泛的代谢组学和代谢组学生物医学社区参与。

相关报告
  • 《代谢组学深度覆盖分析技术研究取得进展》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2018-07-07
    • 近日,中国科学院大连化学物理研究所高分辨分离分析及代谢组学研究组研究员许国旺团队在代谢组学深度覆盖分析技术研究方面取得新进展,相关工作在Analytical Chemistry 杂志上连续发表3篇研究论文。 代谢组学是研究表型的重要工具,但现有技术在代谢组数据采集质量和数据解析方面仍存在很大瓶颈,制约了代谢组技术的大规模应用,发展代谢组高覆盖定量检测和识别技术是代谢组学技术的发展方向。针对上述瓶颈问题,该研究团队开展系统深入研究,通过发展拟靶向代谢组学方法、研究代谢物结构-质谱特征规律、结合结构-色谱保留规律提高代谢组分析的覆盖度,发展代谢物数据库以改进代谢物的批量结构鉴定能力等。 该团队建立了高覆盖度拟靶向脂质组学分析新方法,涵盖19个脂类,3377个脂质离子对,覆盖7000多种脂质分子结构。方法具有良好的线性、重复性,更低的检测线,更高的覆盖度,更好的数据质量,特别适合于大规模脂质组学分析(Anal Chem.)。 该团队还建立了用于酰基肉碱分析的液相色谱-高分辨质谱方法(LC-HRMS),构建了包含758种酰基肉碱的数据库,该数据库是迄今为止最大的酰基肉碱数据库。基于该LC-HRMS方法的深度覆盖分析新策略,可一次性地在临床样品中检测数百种酰基肉碱(Anal Chem.)。 此外,该团队发展了一种综合的代谢物标准数据库构建策略和方法,针对数据采集、数据校正、定性算法,以及仪器间差异等多个方面的问题,提出一套系统解决方案,并研发出代谢物定性数据库软件(Anal Chem.)。 上述代谢组学新方法的提出,对提高代谢组分析的覆盖度和规模化鉴定有极大的促进作用。 该研究得到了国家自然科学基金项目和国家重点研究发展计划的资助。
  • 《全球基因组学与健康联盟发布五年战略规划:共建基因组学数据共享标准》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:huangcui
    • 发布时间:2017-12-12
    • 全球基因组学与健康联盟(Global Alliance for Genomics and Health,GA4GH)公布了名为“GA4GH Connect”的未来五年战略规划,呼吁联盟的500多名成员开发新的数据共享标准,用于当前重大的国际基因组学数据计划。 目前,GA4GH已经与13个项目达成合作,其中包括Genomics England以及Australian Genomics等,用以开发和发布基因组数据挖掘、分析和解读的新标准。在佛罗里达州举办的美国人类遗传学会会议上,联盟讨论了贯穿至2022年的战略规划的具体细节。 除了介绍“GA4GH Connect”五年战略规划,该联盟的主要成员还在BioRxiv发表了一篇社论,题为“Genomics in healthcare: GA4GH looks to 2022”。社论概述了与健康驱动的基因组学相关的期望和挑战。作者强调,从研究资助的基因组学到医疗保健资助的基因组学的转变,使GA4GH制定了其全新战略规划,并将自身重组为一个“以交付为重点的组织”,并为这些项目提供新的工具。 英国剑桥欧洲分子生物学实验室欧洲生物信息学研究所所长、GA4GH指导委员会主席Ewan Birney表示:“内在的关键在于,医学实践将会比科学研究提供更多的基因组学资源。同时,基因组学对健康日益增长的效用意味着……大多数人将在他们生命的某个时间点应用基因组测序。” 传统模式的颠覆 正如Birney在其合著的社论中所概述的那样,GA4GH目前预计,到2022年,多达5000万个基因组将可能被测序。与过去数据存储和共享的方式相比,这些新数据集的可用性将带来新的挑战。而根据Birney的观点,用于研究目的的基因组测序数据通常从单一的位置在国际间共享,并由用户直接下载用于分析,但在国家卫生保健系统中产生的数据必须以不同的方式进行分配。 他说道:“基于这些庞大的健康医疗团体,我们必须对传统范式进行颠覆,并进行虚拟化分析,以确保将数据发送到世界各地安全的云存储位置。要做到这一点,我们需要GA4GH启动新的标准。” GA4GH推出的第一个标准被称为“htsget”。 htsget标准是一个基因组血数据检索规范,它允许用户下载最感兴趣的基因组部分的读取数据。在此之前,用户通常会下载完整的数据集,然后再搜索那些感兴趣的区域,这通常花费巨大且十分耗时。GA4GH旨在通过这些大型基因组项目的合作来开发出这些类型的工具。 Birney说:“这些合作涉及世界上最大的临床基因组项目,我们拥有这些团体水平的技术接触,因此我们希望确保这些标准能够适合这样的大型组织。” 他还指出,GA4GH还试图专门设计可互操作的工具,这将允许用户对各组织和国家之间的数据进行“联合分析”。这些工具不仅能让用户更好地分析和存储数据集,还能将它们整合到罕见和复杂疾病(包括癌症)患者的临床管理中。 Birney补充说,GA4GH已经与全球范围内所有主要的基因组学项目取得了联系,有些项目将在明年加入。该联盟还将于2018年发布一套标准,以使其他项目能够加入。 全新的内部工作流程 为了更好地满足这些驱动项目的需求,GA4GH也在内部进行了重组。GA4GH从2014年开始不再依赖于工作组和任务团队,现在将使用所谓的技术工作流和基础工作流来开发新的标准和工具。技术工作流将由从事设计和实施新标准和工具领域的领导团队组成;基础工作流将针对法律、伦理和数据安全等方面问题提供咨询。 GA4GH五年战略规划中列出的具体技术工作流程包括集中制定临床和表型数据的采集和交流方法、标准化云环境、简化研究人员识别、设计统一的数据挖掘平台,以及开发用于访问和分析大规模基因组数据的标准。 在GA4GH五年战略规划中制订的特定基础工作流将在基因组学的法律法规、伦理和数据安全领域提供指导。值得注意的是,其监管及伦理部门将尝试协调一致的隐私政策和数据监管模式。 同时,这两种工作流程都将由工作流领导管理统筹,为13个大型基因组项目提供它们所需的标准。 为了资助GA4GH的活动,该联盟将依赖Birney所称的“Harlequin资助模式”,得到各个不同背景组织的资助。据悉,支持GA4GH的三个主要研究所分别是博德研究所、维康基金会桑格研究所以及安大略癌症研究所,此外,美国国家卫生研究院(NIH)和加拿大基因组研究中心(Genome Canada)也在支持这一联盟。 如果这些努力取得成功,Birney希望到2022年,可以广泛采用临床级基因组数据的共享标准。正如其所说:“就像我们使用网络一样,没有人会担心什么协议。这正是研究人员和临床医生的共同目标。”