Digital Science旗下的解决方案metafacts和Dimensions近日宣布,备受期待的Dimensions知识图谱已经正式发布。这一大型知识图谱为制药和生命科学行业的人工智能解决方案提供动力。
Dimensions知识图谱由metapactory提供技术支持,是一个综合性的知识图谱解决方案,旨在便于客户将其数据基础设施及现有的内部知识图谱进行集成。该知识图谱的核心是一个明确定义且灵活的语义模型,可以轻松扩展以纳入内部数据(如领域专家知识或内部文档数据),并结合全球研究和内部知识的协同效应,推动商业决策。通过统一的语义层,它能够连接所有相关来源的数据,并增加数据的丰富性和上下文,从而简化并加速生成可循证的决策。
制药和生命科学领域的公司现在可以获取大量相互的全球研究数据,包括约3.5亿条记录,如专利、临床研究报告和出版物,以及公共数据集和本体。这些公司可以结合自己已经拥有的丰富内部数据,利用这些资源推动商业决策和支持人工智能应用。
metafacts的创始人兼首席科学官彼得·哈斯博士强调了Dimensions知识图谱的独特之处,这为人工智能应用(如大型语言模型和生成式人工智能)提供了更高水平的透明度和可信度,这对于制药行业尤为关键。
Dimensions知识图谱的数据基于Dimensions数据库,包括数百万出版物、专利、基金、临床试验、政策文件和技术报告的数据。该数据库不仅支持对出版物的元数据进行搜索,还提供全文搜索和发现功能。
Dimensions知识图谱通过与公共数据集和本体的集成,增强了Dimensions数据,包括基因组学、蛋白质组学、代谢组学、分子相互作用、生物过程和药理学的数据、元数据和关系,并包括来自3.5亿研究产出的元数据和语义注释。此外,用户还可以轻松地将这些数据与内部数据或任何现有的知识图谱结合起来。
Dimensions知识图谱是目前最大的语义注释知识集合,包括以下方面的数据:
? 1.43亿出版物
? 1.6亿专利
? 3000万个数据集
? 700万项拨款
? 200万份政策文件
人员和组织
? 3400万研究人员
? 12900个组织机构
语义注释
? 3070亿个关联语义注释
? 350万个研究完整性信任标记
制药本体/词汇表
? 3800万个概念来自38个领域本体