《研究领域知识组织系统(KOS)综述:资源与挑战》

  • 来源专题:数智化图书情报
  • 编译者: 程冰
  • 发布时间:2025-04-07
  • 3月25日,Angelo Salatino等学者在Quantitative Science Studies上发表了关于研究领域知识组织系统(Knowledge Organization Systems, KOS)的综述文章。KOS包括术语表、叙词表、分类法和本体等,在信息分类、管理和检索中发挥着核心作用。在学术领域,KOS常被用于表征研究领域及其关联关系,主要目标是对研究论文、学术课程、专利、书籍、科学会议、领域专家、基金项目、软件、实验材料等学术成果和主体进行分类。这些结构化的研究领域表征方式已被多学科广泛采用,并证明能有效赋能于AI系统,可帮助提升文献检索效率,支持量化分析科研影响力,以及预测和解析科研动态等功能。

    本文对当前学术领域的KOS进行了全面调研,从五大维度(覆盖范围、结构、维护机制、应用场景、与其它KOS关联性)对45种KOS进行了对比分析。结果显示,现有系统在规模、质量、用途上存在显著差异,跨学科研究知识表征亟需更集成化解决方案。最后,作者还探讨了主要挑战与未来发展方向。


  • 原文来源:https://direct.mit.edu/qss/article/doi/10.1162/qss_a_00363/128602/A-Survey-on-Knowledge-Organization-Systems-of
相关报告
  • 《研究综述:2019年12月6日》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2019-12-10
    • 欢迎来到2019年12月6日的研究综述,这是布罗德研究所的科学家和他们的合作者发表的最新研究的一个重复快照。 寻找增强剂 虽然我们体内的每个细胞都含有相同的基因序列,但增强子控制着基因在不同细胞类型中的表达方式,例如,确保肝细胞不会失控并开始启动肾脏基因。然而,确定和预测哪些增强子调节哪些基因的能力仍然难以捉摸。查理·富尔科、约瑟夫·纳赛尔、杰西·恩格雷茨、研究所所长兼创始主任埃里克·兰德以及来自布罗德和其他地方的同事在《自然·遗传学》杂志上描述了一种可以确定哪些增强子调节哪些基因的实验技术,以及一种预测基因组中增强子-基因连接的模型。由于先前的研究已经将增强子突变与疾病联系起来,这些新工具将对了解人类健康非常重要。 细菌测试进入噬菌体- r阶段 一种快速诊断细菌感染的方法可以帮助病人更快地康复,并防止耐药微生物的传播。每年有3.5万美国人死于耐药微生物。Roby Bhattacharyya是传染病和微生物组项目(IDMP)的核心成员,他和同事们开发了一种新的诊断方法,称为GoPhAST-R,它结合了基因型和表型测试来确定细菌的抗生素敏感性。GoPhAST-R寻找抗生素诱导的基因表达的模式,并识别关键的耐药基因以区分易感和耐药菌株。在《自然医学》杂志上,该方法可以在不到4小时内提供94%到99%的准确率,相比之下,使用标准的临床实验室方法需要28到40小时。 当质量不够大的时候 关于转录因子(TFs)如何与基因启动子一起控制基因表达、细胞表型和细胞状态的规则仍然模糊不清,部分原因是规模问题。在《自然生物技术》,卡尔•德波尔核心研究所细胞天文台特拉维夫Regev董事成员和卡拉曼和他的同事发布了巨大平行记者化验(GPRA):机器学习方法,合并与实验室系统,衡量TFs与超过1亿randomly-synthesized基因启动子序列在酵母基因表达的影响。GPRA揭示了tf -启动子结合的关键特征,并为研究基因变异如何影响基因表达和疾病风险提供了一个创建复杂、全面模型的机会。 将数据和谐地结合在一起 为了充分利用现有的单细胞rna测序(scRNA-seq)研究,研究人员需要能够收集来自各种组织、数据源、测序平台等的数据。Ilya Korsunsky,医学和人口遗传学(MPG)项目的研究所成员Soumya Raychaudhuri,和他的同事开发了Harmony,一种允许科学家整合来自多个数据集的scRNAseq数据的算法。在Nature方法中,他们展示了Harmony的能力:1)处理大型数据集;2)在集成数据中识别宽粒度和细粒度的细胞群;3)处理复杂实验中生成的数据;4)处理来自多个实验平台的数据。Harmony的R包可以在GitHub上找到。 心的读者 潜在的朊病毒疾病治疗的目的是降低大脑中的朊病毒蛋白(PrP),但目前测量脑脊液(CSF)中PrP的方法没有捕获蛋白质片段或不同的构象。Eric Vallabh Minikel、Eric Kuhn、Sonia Vallabh、研究所科学家和蛋白质组学平台主任Steven Carr及其同事开发了一种基于多重反应监测的质谱仪方法,可以精确测量人类和其他模型物种的PrP肽浓度。根据分子和细胞蛋白质组学的报道,他们发现CSF PrP随着疾病的进展而减少,所以降低PrP药物的剂量研究应该集中在有症状的高危个体上。请阅读美国生物化学和分子生物学学会发布的新闻稿。 绘制癌症中免疫细胞的多样性 调节性T细胞(treg)可削弱抗肿瘤免疫反应,因此与几种癌症的不良预后有关。为了更好地了解treg在肿瘤发展中的作用,研究人员利用单细胞RNA测序技术,在基因工程小鼠肺腺癌模型中绘制了肿瘤发展过程中这些细胞的多样性。在《细胞报告》中,由Amy Li、Rebecca Herbst、David Canner、Aviv Regev、癌症项目高级副成员Tyler Jacks及其同事领导的研究小组提供了肿瘤微环境中Tregs多样性的高分辨率视图,从而突出了治疗干预的潜在途径。 肾脏器官会竖起大拇指 从患者诱导多能干细胞(iPS)中培养的人肾脏类器官是一种很有前途的新工具,用于开发急需的精确治疗。学习如何复制这些瀑样跨“诱导多能性”细胞,Ayshwarya萨勃拉曼尼亚,Eriene-Heidi Sidhom, Maheswarareddy Emani,协会成员和肾病倡议主任安娜Greka,和他的同事们分析了约450000个细胞肾瀑样来自四个iPS细胞系,相比他们单细胞概要文件从成人和胎儿肾脏。研究小组发现,类器官的组成和发育是人类肾脏组织的可靠替代物,将类器官移植到小鼠体内可以进一步提高类器官的质量。在自然交流中学习更多。 神经系统炎症的治疗靶点 关于鞘脂代谢在调节中枢神经系统炎症和多发性硬化等疾病中的作用,人们知之甚少。Julian Avila-Pacheco、副成员Francisco Quintana、研究所科学家和代谢组学平台高级主任Clary Clish及其同事通过结合蛋白组学、代谢组学、转录组学和体内遗传微扰研究,发现了鞘脂类代谢对星形胶质细胞的影响。他们的发现发表在《细胞》杂志上,定义了一种驱动促炎性星形细胞活动的新机制,概述了线粒体抗病毒信号蛋白在中枢神经系统炎症中的新作用,并确定了鞘脂类代谢是治疗中枢神经系统炎症的一个有希望的靶点。 疟原虫将如何抵抗这种药物? 恶性疟原虫对临床使用的每一种疟疾药物都产生了迅速的耐药性。在药物开发的早期就发现这种寄生虫的分子逃逸路线,可以帮助研究人员找到更好的药物。为了解决这个问题,IDMP研究所的成员Dyann Wirth和她的团队设计了一种预测疟原虫抗性机制的方法,他们在《科学转化医学》上描述了这种方法。研究人员在体外和受感染的小鼠体内都将这种寄生虫暴露在能够阻断疟疾病毒的二氢旋转脱氢酶(DHODH)的化合物中。然后,他们选择耐药生物并对其基因组进行排序。研究小组发现,在体外和小鼠体内,耐药寄生虫也出现了类似的快速耐药性和共同突变。研究人员得出结论,选择体外耐药性可以预测体内耐药性,并认为这种方法可用于潜在新药的筛选。 解密蛋白质串扰,一次一个细胞 蛋白质参与功能途径并形成一系列复杂的相互作用来驱动细胞的行为。理解这种“相互作用组”对于理解驱动生物学的机制至关重要。尽管科学家们创造了一个有价值的“参考相互作用组”,将这些相互作用概括为一个单一的资源,但这种工具无法提供特定于不同细胞类型的信息。 Shahin Mohammadi,Jose Davila-Velderrain和Epigenomics Program准成员Manolis Kellis在Cell Systems中描述了一种计算框架(SCINET),该框架可以单细胞分辨率分析此相互作用基因组。使用scRNA-seq,SCINET可以在单个细胞中重建相互作用基因组,从而使研究人员能够识别在各种条件下受干扰的单细胞相互作用。 与ALS相关的新基因 肌萎缩性侧索硬化症(ALS)是一种迟发性神经退行性疾病,众所周知,遗传因素是造成这一疾病的危险因素。为了发现与ALS相关的新基因,由Sali Farhan和研究所成员Benjamin Neale领导的一个小组在MPG中分析了3864名患者和7839名健康个体的外显子组,这是迄今为止最大的ALS外显子组病例对照研究。研究小组观察到ALS病例中罕见的蛋白质截短遗传变异,以及与已知ALS基因和新基因DNAJC7的关联。可通过ALS知识门户网站获得ALS遗传数据的摘要统计信息。查看《自然神经科学》中的完整故事。 自闭症和多动症之间的遗传相似性 自闭症谱系障碍(ASD)和注意力缺陷多动障碍(ADHD)具有重要的遗传成分,但是要收集大量的人群进行遗传分析一直是这两者的挑战。由Kyle Satterstrom,研究所成员,MPG联合主任Mark Daly和丹麦iPSYCH研究计划的同事组成的团队,利用已归档血斑的DNA分析了大约8,000名患有ASD和/或ADHD的儿童的外显子组以及5,000个对照,以更好地了解这些疾病的遗传结构。研究人员发现,ASD和ADHD在限制基因中截短变异的负担相似,并确定MAP1A基因中截短变异与患病风险有关。从《自然神经科学》和iPSYCH的新闻稿中了解更多信息。
  • 《研究综述:2020年11月20日》

    • 来源专题:人类遗传资源和特殊生物资源流失
    • 编译者:yanyf@mail.las.ac.cn
    • 发布时间:2020-11-25
    • 欢迎收看2020年11月20日的《研究综述》(Research Roundup),这是一篇由Broad Institute的科学家及其合作者发表的最新研究的重现快照。 从MUC1到COVID-19临床试验 正常情况下,MUC1会在肺部生成粘液,但过量的MUC1会导致与COVID-19相关的肺损伤。Maria Alimova, Eriene Sidhom,肾脏疾病计划的主任和协会成员Anna Greka和同事们重新分析了Greka实验室针对MUC1肾脏疾病(一种罕见的肾脏疾病)进行的药物再用途中心药物筛选的数据,发现了一种fda批准的名为fostamatinib的药物可以阻断这种蛋白质。该团队表明,该药物减少了人类细胞和急性肺损伤小鼠肺中的MUC1,这支持了目前在covid19患者中测试fostamatinib的两个临床试验的原理。阅读更多的细胞报告,医学和一个广泛的故事。 在SARS-CoV-2上亮灯 Jon Arizti Sanz、Catherine Freije和Cameron Myhrvold在传染病和微生物组项目(IDMP)、传染病基因组中心和研究所成员Pardis Sabeti的实验室工作,他们和同事使用SHERLOCK诊断技术开发了一种名为SHINE的COVID-19快速检测方法。这种测试不需要笨重的实验室设备,而且有一天可以在医院和实验室之外进行SARS-CoV-2的检测,它使用Cas13来检测SARS-CoV-2 RNA,与基于标准qpcr的测试相比有几个优势。它将病毒灭活步骤减少到10分钟,在稳定的温度下扩增病毒RNA(不需要某些设备),并将扩增和检测结合在一个步骤中。阅读更多的自然通讯和一个广泛的故事。 乳腺癌的新观点 乳腺癌是一种多种多样的疾病,对医生和科学家来说,为患者量身定做有前景的治疗组合是一项挑战。使用NCI的临床肿瘤蛋白质组学分析财团(CPTAC),卡斯滕·克鲁格,Shankha Satpathy还,摩尼博士研究所科学家史蒂文•卡尔和迈克尔·吉列的蛋白质组学平台,与同事一起贝勒医学院和其他地方,进行全面的蛋白质组学和基因组——或者proteogenomic——分析的一套大型的乳房肿瘤。他们的发现发表在《细胞》杂志上,强调了新的肿瘤亚型、代谢弱点、免疫治疗机会等,并提出了蛋白质基因组学在癌症诊断和治疗计划中的作用。详情请参阅Broad/Baylor/CPTAC新闻稿。 深入挖掘可以发现差异 使用标准方法的种系遗传分析可以在一小部分癌症患者中识别罕见的致病性变异。由博士后学者Saud AlDubayan和Dana-Farber癌症研究所的副研究员Eliezer Van Allen领导的研究小组分析了数千名前列腺癌或黑色素瘤患者的种系数据,首先使用标准方法,然后使用深度变异,一种深度神经网络分析框架。他们发现,深度学习极大地增强了在数千种癌症易感性和其他临床相关基因中发现有益种系变异的能力。在达纳-法伯的视频,tweeter和JAMA了解更多。 微生物基因组 研究微生物CRISPR系统的不依赖于培养的方法,如宏基因组学,可以揭示尚未探索的CRISPR系统多样性。由相关研究人员菲利普·蒙克、亥姆霍兹感染研究中心的爱丽丝·姆查迪和哈佛大学公共卫生学院的IDMP准成员柯蒂斯·哈坦豪尔领导的研究小组使用2355个元基因组分析了人体微生物组中的CRISPR位点和cas基因。科学家们发现了近300万个独特的CRISPR空间,将已知的多样性增加了13倍,口腔栖息地的CRISPR负载高于肠道/泌尿生殖部位。在《细胞宿主与微生物》中描述了这项工作,它提供了人类微生物群系中天然CRISPR-cas位点和靶点的地图。 建立它们,摧毁它们 靶向降解是一种很有前途的方法来攻击各种癌症目标。靶向降解是一种小分子诱骗癌细胞破坏其赖以生存的蛋白质。在《自然》杂志上,来自癌症项目的研究人员和Dana-Farber,包括Mikolaj Slabicki, Hojong Yoon, Jonas Koeppel,研究所成员Benjamin Ebert和Eric Fischer讨论了触发蛋白质降解的一种新机制,即化合物诱导其目标形成聚合物,然后由细胞处理系统降解。这个动画展示了一种名为BI-3802的化合物是如何使用这种药物诱导聚合机制来清除细胞中的BCL6的,BCL6是一种淋巴管相关的转录因子。 肝脏是如何恢复的 肝脏在受伤后具有不可思议的再生能力。然而,在进行这一进程的同时,它必须仍然保持重要的功能。通过使用单细胞RNA测序、原位转录和蛋白质组分析以及小鼠的敲除模型,Chad Walesky (BWH)、Kellie Kolb (MIT)、研究所成员Alex Shalek、代谢项目副成员Wolfram Goessling及其同事已经揭示了使这一功能得以持续的机制。受损后留在肝脏的细胞会暂时增加关键基因的表达,并改变其正常的区域特异性功能,以弥补失去的细胞,而肝脏内的其他细胞则控制新组织的生长。详情请阅读《自然通讯》。 在美国航空志愿队(飞虎队) 在质谱分析中,数据独立采集(DIA)有潜力全面分析生物样品中超过仪器检测极限的所有肽。然而,在DIA数据分析中仍然存在一些挑战,每种分析工具都显示出可检测肽和定量结果的可变性。为了解决这些差异,研究科学家Sebastian Vaca, Steven Carr,蛋白质组学平台访问科学家Jacob Jaffe (Inzen Therapeutics)和其他人设计了AvG,一个用于抛光DIA数据的模块化工具。在《自然方法》中,他们报道了AvG使DIA信号达到最高的灵敏度、选择性和准确性水平。 非整倍体可以保护癌细胞 癌细胞通常拥有异常数量的染色体,这种情况被称为非整倍体。在许多癌症类型中,非整倍体与细胞增殖缓慢和患者预后不良矛盾地相关。约翰迈克尔Replogle领导的研究小组(麻省理工学院),准会员Angelika Amon,和他的同事们调查了这些观察的潜在机制,非整倍体对细胞分裂的影响,发现实际上增加了抵抗前线化疗:扩散放缓下来减少了药物能破坏癌细胞的DNA和微管。