《基于ELM模型的开放科学数据重用信任评估要素研究》

  • 来源专题:数智化图书情报
  • 编译者: 张源枝
  • 发布时间:2025-09-30
  • [目的/意义] 信任在开放科学数据重用中扮演着重要的驱动作用,从信息加工理论视角探索开放科学存储库数据重用信任评估要素,可以对国内陆续建设的开放数据存储库管理以及提升数据的重用率起到借鉴和推进作用。[方法/过程] 基于信息加工理论的精细加工可能性模型(ELM)构建开放科学数据重用信任评估模型,以目前科研数据聚集速度和重用最为活跃的kaggle平台的实际数据进行剖析和验证,并选择线性核函数的支持向量回归(SVR)分析和比较不同变量对开放科学数据重用信任的影响。[结果/结论] 来源特征信息和内容特征信息整体上与数据集下载量和数据集引用量存在显著正相关关系,但具体因素对两者的影响存在差异。基于分析结果,提出提升数据集质量、加强数据透明度和可追溯性、鼓励用户参与和评价、推动数据共享和交流以及建立信任评估体系等措施。
  • 原文来源:https://www.lis.ac.cn/CN/10.13266/j.issn.0252-3116.2025.20.009
相关报告
  • 《基于ELM的AIGC用户信任研究》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2025-07-22
    • [目的/意义]研究AIGC用户信任形成机理,从而采取措施建立用户信任,促进其采纳和使用行为。[方法/过程]基于ELM,考察中心因素和外围因素对AIGC用户信任的影响,采用SEM和fsQCA进行数据分析。[结果/结论]中心因素(感知准确性、感知个性化、内容可解释性)和外围因素(拟人化、感知偏见、隐私风险)、信任倾向显著影响用户对AIGC的信任。此外,算法素养对信任具有调节作用。因此,AIGC平台需要关注中心因素和外围因素两方面,进而提升用户信任,促进其使用行为。
  • 《数据要素视角下的科学数据非正式引用识别研究》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2025-07-22
    • 【目的/意义】科学数据作为科学研究成果的表现形式之一,多以非正式引用的形式隐藏于学术论文之中。 从学术论文中自动识别数据引用信息从而提取数据要素,为科学数据要素的组织提供了新思路。【方法/过程】为提高正例文本占比进而提升数据引用句的识别效果,基于生物信息学领域论文全文数据,采用篇章结构识别和数据增强、随机欠采样、特征词筛选3种不平衡语料采样方法构建语料集,再分别结合5种文本分类模型构建数据引用识别流程。【结果/结论】研究发现,从学术论文中识别数据引用句是细化数据要素组织的有效环节;篇章结构识别 和不平衡语料采样方法可以有效提升数据引用句的识别性能;较之传统的机器学习模型,BERT类深度学习模型在数据引用文本分类中性能更优。【创新/局限】从学术论文中识别非正式数据引用句为数据要素组织带来新的视角, 是收集高价值数据要素的高效方法。然而,由于论文中数据引用不规范且数量稀疏,分类精确率仍有提升空间。