《融合网络结构特征的学科新兴主题识别方法研究》

  • 来源专题:数智化图书情报
  • 编译者: 程冰
  • 发布时间:2025-08-18
  • 学科新兴主题识别是及时发现科技创新发展动态、追踪学科发展趋势的有效方法。学科新兴主题的涌现是一个复杂的过程,不仅受科学交流过程的影响还受网络自组织过程的影响。学科新兴主题的网络结构在一定程度上嵌入了其特有性质。本文在常见科学交流属性特征的基础上,融合学科主题在网络中的全局和局部网络结构特征,通过随机匹配生成标准实验数据集,先后运用多指标加权融合方法与机器学习分类方法识别学科新兴主题。研究结果表明,多指标加权融合方法对识别影响力排序靠前的学科主题表现较好。但是,高影响力主题仅占60%,低于随机森林分类识别模型的最优性能64.14%,这表明机器学习分类识别方法在拟合复杂过程方面具有优势,而多指标加权融合方法更适用于关注顶尖影响力主题的任务。机器学习可解释分析结果表明,吸纳引用频次较多、网络影响力较高、论文发表较多、关注作者影响力与期刊影响力较强对高影响力主题识别起正向作用;与之相反,结构突变程度高对学科新兴主题识别有负向作用。
  • 原文来源:https://d.wanfangdata.com.cn/periodical/qbxb202506001
相关报告
  • 《基于异质图注意力网络与多特征融合的跨社交媒体用户识别研究》

    • 来源专题:数智化图书情报
    • 编译者:杜晴
    • 发布时间:2024-12-26
    • 跨社交媒体用户识别对于网络舆情的协同治理以及用户偏好的全方位识别与预测具有重要的指导意义。针对现有方法存在数据表达能力弱、忽略用户信息的动态性和关联性的问题,本文提出一种融合异质特征嵌入与实体动态关联的跨社交媒体用户识别模型。首先,整合用户的基本属性、生成内容和社交结构信息,构建各个社交媒体的异质信息网络;其次,通过设计新的元路径识别策略构造邻接矩阵,使用异质图注意力网络模型汇聚用户节点信息,增强节点特征的表示能力;再其次,引入了3种连续时间衰减函数,对跨社交媒体的实体相似矩阵进行加权,增强实体之间的动态关联;最后,融合单社交网络和跨社交网络中的以上特征,利用多层感知机实现跨社交媒体用户的识别和预测。在微博-知乎真实数据集中的研究结果显示,本文模型的整体性能优于其他基准模型,特别是线性衰减函数,其展现了最佳效果,且本文提出的元路径识别策略对提升用户识别效果具有重要作用。
  • 《融合多重专利关系网络指标的高质量专利识别研究》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2025-07-22
    • [目的/意义] 考虑专利引用网络、发明网络、类别关联网络中节点结构重要性,提出融合多重专利关系网络指标的高质量专利识别方法。[方法/过程] 基于专利的引用、发明人和分类信息构建多重专利关系网络,从中提取度中心度、中介中心度、接近中心度、特征向量中心度和PageRank指标衡量专利节点结构重要性,然后融合网络指标与传统专利质量评估指标形成指标体系,最后将其输入到机器学习模型以判断专利是否高质量。[结果/结论] 基于美国专利商标局数据的实证分析表明,融合多重专利关系网络指标能够显著提升高质量专利识别效果,且模型特征重要性排序前4位中有两个网络指标,这进一步说明网络指标在高质量专利识别中的关键作用。