针对知识单元引用网络中关联关系单一的局限,本文通过引用功能增强网络节点之间语义关联类型,提出一种引用功能感知的知识单元引用网络,并进行领域知识多维分析。首先对学术文本进行解析,抽取文献间引用关系、引文上下文以及引用对象等信息,并对引用功能和引用对象进行自动识别。在此基础上,采用复杂网络图方法构建引用功能感知的知识单元引用网络,从网络结构分析与可视化、知识单元多维引用关联分析、知识群落分析 3 个方面进行领域知识多维分析,并以国际计算语言学协会会议论文数据集为例进行实证研究。结果验证了本文所提出方法的有效性,发现了特定领域知识间使用、扩展和对比模式,丰富了知识群落的语义信息。本文扩展了知识单元引用网络的研究方法,深层次揭示了学科知识之间的语义关联,为学科知识结构分析提供了一种新的路径。
研究方法包括对学术文本的解析,抽取文献间引用关系、引文上下文和引用对象,并自动识别引用功能和引用对象。利用复杂网络图方法,构建了引用功能感知的知识单元引用网络,并从网络结构分析与可视化、知识单元多维引用关联分析、知识群落分析三个方面进行领域知识的多维分析。实证研究以国际计算语言学协会(ACL)会议论文数据集为例,验证了所提方法的有效性,并发现了特定领域知识间的使用、扩展和对比模式。
图1-整体研究框架
文章还回顾了知识单元引用网络和语义功能感知的科学知识网络的相关研究,指出现有研究在语义功能增强方面的不足,并强调了从引用功能视角进行知识单元引用网络语义增强和分析的重要性。此外,文章也探讨了引文语义功能识别的相关研究,包括引用功能和引用对象的识别方法,以及这些方法在科学知识网络中的应用。
在研究方法部分,本文详细介绍了数据收集与预处理、引用功能与引用对象识别方法、以及引用功能感知的知识单元引用网络构建方法。数据收集涉及ACL会议论文集的全文文献,通过Grobid工具解析成xml格式,便于信息抽取。引用功能和引用对象的识别采用了BERT+Bi-LSTM+Attention模型和BERT+CRF模型,这些模型结合了深度学习和序列标注技术,以提高识别的准确性。
实验与结果部分展示了引用功能和引用对象识别的实验结果,以及网络结构分析与可视化的结果。实验结果显示,所设计的模型在引用功能识别任务上取得了高准确率,而在引用对象识别任务上,BERT+Bi-LSTM+CRF模型表现更佳。网络结构分析揭示了网络的稀疏性、平均度、平均加权度等特征,并通过Gephi工具进行了网络可视化。
研究成果指出本文提出的引用功能感知的知识单元引用网络能够细粒度地揭示领域知识间的关联关系,为科学知识图谱绘制和知识结构分析提供了新的视角。同时,文章也指出了研究的不足之处,如数据规模较小、对施引文献知识单元处理简单等问题,并提出了后续研究的方向。
本文通过构建和分析引用功能感知的知识单元引用网络,为理解和揭示科学知识发展变化的特征和规律提供了新的研究方法和视角。