2025年5月14日《科学》杂志新闻栏目报道,作者利用公共数据集和AI技术,导致低质量论文数量激增,论文工厂可能助长了“虚假发现”。
萨里大学统计学家Matt Spick发现,其担任副主编的《科学报告》期刊每天收到1-2篇高度雷同的论文,均基于国家健康与营养调查(NHANES)等公共数据集的研究。2024年10月前的统计显示,此类论文数量从2014-2021年的年均4篇飙升至2024年的190篇,增长近50倍。
Spick发现,收到的NHANES 论文都遵循相同的模式,选择健康问题(如抑郁症)、关联因素(如维生素D水平)和特定人群(如65岁以上男性),通过排列组合生成"新发现",好像每一种可能的组合都有人在研究。一些较新的 NHANES 研究,选择性地分析了其数据集的部分内容,却没有明确的理由,缺乏科学依据。例如,28项关于抑郁症的研究中,仅13项通过假阳性校正检验,显示超半数结论可能为统计噪声。
悉尼大学分子生物学家Jennifer Byrne指出,AI工具(如ChatGPT)被用于批量改写内容规避查重,这种操作难以溯源但具有明显组织性特征。
西北大学的元科学家Reese Richardson表示,这些免费数据源几乎允许任何人采用已知的研究方法,替换其中的变量,从而创造出新的“发现”,就像一种“研究填词游戏”。他表示,其他研究人员在多个主题中也发现了类似的“爆发”现象,包括遗传学研究、对不同科学学科中的文献计量或性别差异分析。
Richardson表示,这些论文反映了科学出版和研究奖励机制中的广泛问题,“文章中提到的所有出版商都接受了费用,可能每篇约为 1000 美元,以发表这些垃圾论文。” 当前的科学出版机制是研究人员被激励发表更多论文,而不是更高质量的论文。除非我们彻底重构科学出版的激励机制,否则问题“只会变得更糟”。