《基于LDA和本体的科学前沿识别与分析方法研究》

  • 来源专题:图书情报
  • 编译者: xuxue
  • 发布时间:2017-09-28
  • [目的/意义] 鉴于及时准确把握科学前沿的重要意义,文章针对目前科学前沿识别方法存在的问题,提出基于LDA和本体的科学前沿识别及分析方法。[方法/过程] 通过LDA模型抽取研究主题,采用主题强度和主题新颖度两个指标来识别科学前沿主题,并基于领域本体进行概念映射来挖掘科学前沿主题的语义类型,从而实现科学前沿的语义分析。[结果/结论] 基于LDA模型抽取的10个研究主题中,确定了4个科学前沿。该方法在科学前沿主题的表示方面,主题识别的方法和结果的语义分析方面都有一定的改进。

相关报告
  • 《科睿唯安与中国科学院联合发布《2023研究前沿》,揭示全球热点和新兴前沿研究》

    • 来源专题:数智化图书情报
    • 编译者:杨小芳
    • 发布时间:2023-12-01
    • 2023年11月28日 —— 科睿唯安与中国科学院今天联合发布《2023研究前沿》报告,遴选和展示自然科学和社会科学的11大学科领域中的热点前沿和新兴前沿。今年是双方连续第10年携手发布《研究前沿》系列报告。 今年的报告遴选出128个研究前沿,包括110 个热点前沿和18个新兴前沿。报告为科研管理者和政策制定者提供了全球科研的最新进展和动态,帮助他们以有限的资源来支持和推进科学进步。 在《研究前沿》报告中,定义一个被称作研究前沿的专业领域的方法,源自于科学研究之间存在的某种特定的共性。这种共性可能来自于实验数据,也可能来自于研究方法,或者概念和假设,并反映在研究人员在论文中引用其他同行的工作这一学术行为之中。通过持续跟踪全球最重要的科研和学术论文,研究分析论文被引用的模式和聚类,特别是成簇的高被引论文频繁地共同被引用的情况,可以发现研究前沿。当一簇高被引论文共同被引用的情形达到一定的活跃度和连贯性时,就形成一个研究前沿。《2023研究前沿》报告以文献计量学中的共被引分析方法为基础,基于科睿唯安的Essential Science Indicators? (ESI)数据库中的12922个研究前沿。 科睿唯安与中国科学院同时发布了《2023研究前沿热度指数》报告,评估了世界主要国家和地区在128个研究前沿中的研究活跃程度。 点击链接提交表格,可下载《2023研究前沿》和《2023研究前沿热度指数》中文报告。
  • 《共词分析识别研究热点的效标关联效度研究:基于自然语言处理》

    • 来源专题:图书情报
    • 编译者:lixiaoyan
    • 发布时间:2018-07-23
    • 本文系国家自然科学基金项目“基于共词分析的科学计量信效度研究”(项目编号:71563042)研究成果之一。文章应用自然语言处理的方法,对样本文献中的题名、摘要和全文进行分词,并连同关键词一起,分别提取了四种分析单元下的高频词并应用Pajek和Sci2两个软件工具和常用的八种指标(算法)分别进行了研究热点的识别。然后,以全文为效标,分别运用相关分析和配对样本t检验,对题名、摘要和关键词在研究热点识别上的同时效度进行了检验。研究发现:(1)基于摘要而识别的研究热点同时效度最高,而基于关键词所识别的研究热点同时效度相对较低,具有一定效度风险;(2)在研究热点的识别方面,文本比词的同时效度高,而且文本的长度对于同时效度有着一定影响。