arXiv是一个研究共享平台,其目的是促进全球的科学创新和公平获取。自 1991 年成立以来,arXiv一直免费向所有人开放。30多年来,arXiv一直是开放获取的先驱,目前在8个学科领域托管了超过230万篇学术文章。arXiv不仅是一个文章存储库,还提供了更多功能:arXiv提供文章提交门户、TeX编译服务、搜索和发现工具、面向读者的网页分发、API访问、机器可读数据集,以及由社区开发的工具来增强用户体验。
第一部分:arXiv in Numbers
图1. arXiv在各类数据上的分析
第二部分:arXiv as an Organization
本节讨论了arXiv的财务报告、会员计划和额外的资金支持。此外还概述了新的治理模型以及与Invest in Open Infrastructure的合作。
(一)财务报告
arXiv在2023财年结束时,收到的馈赠和会员捐款比预期少了231,475美元(15%),人员开支也高于前几年。在连续两年的捐款超出预期并且arXiv为其财务储备做出了贡献之后,2023财年依赖储备来平衡预算。需要注意的是,最初的2023年预算比前几年多得多,以适应我们的技术迁移。然而,支持该项目的赞助资金和相应的员工增长被推迟到2024财年年初,因此,年终实际数字与预算数字不符。
2024财年的预算显著高于前一年的预算。这一增加反映了来自西蒙斯基金会为期三年的赞助资金的第一年,用于将arXiv迁移到云端并完成相关的代码更新工作。人员费用的增加与arXiv开发团队的招聘有关,这些人员将致力于技术迁移工作。再次计划在2024财年使用运营储备资金,同时努力扩大资金来源。
(二)新型治理模式——公平代表、问责制和透明度
2023年,arXiv 实施了新的治理模式。为了更好地满足arXiv的多样化需求,成立了三个咨询委员会:编辑咨询委员会、科学咨询委员会和机构咨询委员会。这种结构将通过简化决策来提高效率,通过明确的角色确立问责制,并通过促进反映arXiv社区多样性的公平代表来增加新声音和新想法的机会。
arXiv的新型治理结构可以倾听来自不同利益相关者和社区成员群体的意见,同时简化决策。arXiv的三个咨询委员会并行运作,彼此互补。咨询委员会主席共同构成了arXiv咨询委员会的核心。
图2. arXiv的新治理结构
(三)运营路线——与 Invest in Open Infrastructure 合作
2023年,在Simons基金会的支持下,arXiv开始与Invest in Open Infrastructure(IOI)合作,为arXiv的未来制定战略路线图,以便arXiv够在运营和财务上保持可行、开源和以用户为中心。IOI 的使命是通过向开放基础设施的机构和资助者提供可操作的、基于证据的指导和工具,增加对开放基础设施的投资使用。IOI与arXiv的合作于2023年3月开始,并将持续到2024年6月。arXiv与IOI合作的主要目标是:
(1)识别可持续和多样化且与使命一致的潜在资金;
(2)扩大运营能力和流程以实现持续增长;
(3)为社区参与和治理设计强大的架构。
(四)会员筹资
arXiv的会员计划是其筹款和社区参与工作的重要组成部分。在2022财年,arXiv推出了其更新的会员计划,即基于机构提交的新费用结构。新结构的目的是在增加每个类别中机构数量的同时保持较低的会员费。
arXiv与SCOSS(全球开放科学服务可持续性联盟)的合作继续加强了arXiv的会员资格。arXiv最初与SCOSS的合作招募了近50个新的机构捐赠者,由全球10个联盟代表。在2023财年,arXiv不仅留下了许多旧机构,而且继续通过与全球联盟的外展工作和SCOSS网络带来了更多的成员。
图3.arxiv的资金来源
(五)慷慨的额外捐赠
此外,arXiv在2023年也获得了Simons基金会和美国国家科学基金会的资金。这笔资金对于帮助arXiv实现技术和搜索功能的现代化,并在未来几年继续提高语料库的可访问性至关重要。
第三部分:arXiv in Practice
从理论上讲,arXiv的想法很简单——研究应该是快速的、免费的,并且对所有人开放。所以每一天,arXiv都提供这样的服务:只需点击一个按钮即可获得前沿研究。
研究人员在arXiv上分享的科学论文通常是多年辛勤工作、同事之间的合作、成功抑或是失败的结晶。arXiv的工作人员认真对待这一被托付的知识体系,不仅要确保研究结果得到快速传播,以便可以广泛分享,而且要确保研究是可发现的,能够作为学术记录的一部分得到妥善保存,并为所有人所访问。
arXiv技术、编辑和用户支持团队共同努力,创建使共享和阅读研究更便利的工具。2023年,这些支持团队帮助arXiv的所有新论文推出了实验HTML 格式,以提高可访问性。他们还开发了arXiv Check——一种内部工具,用于简化用户支持和审核工作。
自1991年以来,arXiv一直提供研究论文的访问。如今,arxiv.org每小时平均获得200,000次点击,大多数访问者直接登陆摘要页面或PDF。该服务平均每月收到17,300份提交,每月下载量超过4,600万次。自成立以来,arXiv的下载量已超过30亿篇,而且这个数字还在不断增长。作为研究共享平台,arXiv 的主要目标之一是保持稳定、快速和易于使用,以便用户可以快速安全地共享和发现研究。arXiv开发团队的任务是确保arXiv保持快速,同时引入新技术以改善用户体验、网站互操作性以及与学术出版生态系统的集成。
arXiv-CE(“云版”)项目将所有arXiv服务迁移到云。arXiv-CE的目标是提高稳定性和容量,轻松扩展到新的主题类别,并允许更轻松地与其他服务集成。2023年,arXiv开发团队实现了从云端为所有浏览和文章下载提供服务的目标,并且通过Fastly捐赠的内容交付网络服务,arXiv继续提高全球研究人员访问arXiv整个语料库的速度。值得一提的是,在此过程中多亏了Simons基金会专门用于技术现代化的资金,arXiv才得以在2023年扩大其开发团队。
表面来看,arXiv是一个网站,研究人员只需按一下按钮即可分享和阅读研究文章,无需付费墙。这个简单的答案并没有错,但arXiv远不止这些。arXiv托管了超过230万篇文章,代表了一个巨大的信息来源。研究结果、文章内容及其元数据都可以通过公共API访问,这意味着arXiv上的文章可以在各种学术平台上被发现。arXiv致力于改进和维护互操作性,以帮助科学通信实现大规模互连。2023年,arXivLabs在arxiv.org上启动了四项新的合作——CatalyzeX Code Finder for Papers、DagsHub、Influence Flower和TXYZ.AI。截至2023年底,ar5iv作为一个在2022年启动的arXivLabs集成项目,已成功地以arXiv的HTML论文项目的形式“内部化”。
第四部分:arXiv in the Community
没有什么是孤立存在的。无论是共享数据和代码、跨机构协作,还是突破跨学科思维的界限,研究都是一项日益相互关联的工作。arXiv就是要把点与点连接起来,帮助研究人员快速、公开地分享研究成果,以便他们能够获得新发现并在全球范围内开展合作。arXiv是许多倡导公平和开放研究的机构和组织的连接点,是社区主导的资源。
arXiv寻求通过消除科学研究的所有障碍来满足公共利益。2022年,arXiv与40多名专家和 arXiv社区成员一起完成了深入的用户研究。为了实现真正的开放获取,我们需要确保研究成果是可访问的。