本文的目的是介绍一种从Web of Science等科学数据库中检索一套科学文献的方法,并应用科学计量学指标与其他领域进行比较的方法。
文章提出了一种基于统计分类的信息提取方法。在此方法中,首先引入概率模型,利用关键词提取技术对其进行建模。然后,根据贝叶斯分类,从WoS的所有伊朗报纸中检索与IT相关的文章。基于概率模型,他们为数据库中的每一篇文章分配一个IT成员概率,然后他们检索具有最高概率的文章。
作者从关键词提取过程中提取了一组IT关键字,通过关键词提取过程,得到了概率模型。他们用两种方法评估了所提出的检索方法:(1)通过查询法从WoS中检索文章,使用一组由有限的IT关键词组成的检索式进行查询,(2)通过WoS类别和研究领域检索文章,即基于领域检索。结果表明,该方法能够产生更准确的检索结果,检索文章相关度也有一定提高。