《Digital Science发布《2020年开放数据状况》报告》

  • 来源专题:科技大数据监测服务平台
  • 编译者: zhoujie
  • 发布时间:2020-12-07
  • 《开放数据状况报告》是目前持续时间最长的纵向研究,该研究创建于2016年,旨在考察研究人员使用开放数据的态度和经验--共享数据、重复使用和重新分配数据。

    今年的调查收到了来自研究界的约4,500份答复,并额外关注COVID-19大流行后的研究实践。调查询问研究人员,新冠大流行如何影响他们开展研究的能力,以及他们对数据再利用和合作的看法。

    关键的COVID-19调查结果包括:

    三分之一(32%)的学术研究人员报告说,他们的研究受到COVID-19爆发的“极端”或“非常”影响。

    受COVID-19影响最大的学科是化学(47%),生物学(39%),医学(36%)和材料科学(36%)。在人文和社会科学领域,报告的影响程度最低(20%)。

    43%的被调查者已经或可能在一定程度上将其拨款重新用于COVID-19研究。

    一半的受访者认为,封锁可能会导致其他实验室提供的开放数据的重复使用,65%的受访者希望重用自己的数据。

    超过三分之一的研究人员表示,他们希望COVID-19能带来更多的合作;对于巴西和印度等国家的研究人员来说,COVID-19对研究的影响似乎很大,约有一半的研究人员预计合作会因此而增加。

    其他主要发现:

    从未制定数据管理计划的受访者数量从30%减少到15%。

    2018年,60%的受访者从未听说过FAIR原则,今年这个数字下降到39%,整体熟悉度从15%上升到24%。

    55%的受访者认为共享数据应成为授予资助的要求之一。

    29%的受访者不知道由谁承担开放研究数据的费用。

    只有13%的受访者认为研究人员目前获得了足够的声誉(credit)来共享数据,而59%的受访者认为他们获得的声誉(credit)太少了。

    来源:

    https://www.digital-science.com/blog/news/the-state-of-open-data-2020/

  • 原文来源:https://mp.weixin.qq.com/s?__biz=MzAwNTAyMDY0MQ==&mid=2652586514&idx=2&sn=4b01048b26902a154c38eb5e2f55d723&chksm=80ccec9cb7bb658aea764fa48226829e97a18516447a1576379ea1b17b01944b94017bdad169&mpshare=1&scene=23&srcid=1207hOW18qVKcfqMJ3xststi&sharer_sharetime=1607303581829&sharer_shareid=9e8fc1f0c4813654867c146bb6c9bb7e#rd
相关报告
  • 《2024年开放基础设施状况报告》

    • 来源专题:科技出版市场动态监测
    • 编译者:崔颖
    • 发布时间:2024-11-29
    • 一、所选开放式基础设施的特征 《开放基础设施状况报告》提供了IOI(Invest in Open Infrastructure,投资开放基础设施)的开放基础设施发现工具Infra Finder中列出的OI(Open Infrastructure,开放基础设施)的一般特征的年度快报。 84个OI受邀参与Infra Finder的第一轮数据收集;其中57人接受了邀请并提供了信息。如果在发出邀请时,基础设施已完全运行并作为学术生态系统在整个研究生命周期中履行其功能所需的服务、协议、标准或软件积极使用,则该基础设施有资格被纳入。基础设施还必须满足以下一项或多项资格标准: 符合OSS(open source software,开源软件)的定义; 主要或独家分发开放许可(开放获取)内容; 任何人都可以免费使用(免费或其他限制); 由社区管理,运营和财务透明; 由非营利性或非商业实体运营。 二、开放基础设施赠款资金的现状 在IOI,我们增加对OI投资的工作依赖于对基础设施的融资方式和资金来源的深刻理解。自2020年以来,我们研究、分析并发布了关于OI研究和奖学金资助前景的调查结果。赠款资金只是支持开放式基础设施的一种收入来源,研究表明,财务贡献(包括赠款)是许多OI的主要收入来源。 三、开放式基础设施治理:当前结构、命名法、构成和趋势 许多支持研究和学术的开放式基础设施部署了某种形式的“社区治理”,这是一个相对宽松的术语,用于描述广泛的实践。在最基本的层面上,治理仅仅意味着制定和执行决策,在这个框架内,“社区治理”通常意味着社区的成员以某种方式有意识地参与决策过程。社区治理工作通常是无偿的,由志愿者提供,而不是由工作人员或能够从计划或服务中获得直接经济利益的人提供。 社区治理的概念在整个开放空间中得到倡导,许多开放基础设施明确声称是“社区治理”或“社区主导”的。这种社区参与通常被用作学术交流生态系统内外的差异化和信任的标志。 四、开放式基础设施性能和采用的趋势 根据对各种开放式基础设施服务和计划的观察,通过Infra Finder收集的数据,以及与他们的对话,我们见证并记录了许多关于开放式基础设施增长、发展和向弹性过渡的明确信号。其中包括一系列重要趋势,从新的合作伙伴关系和资金,到技术升级和应用的里程碑。证明这些趋势的具体例子包括由斯隆基金会资助的Dryad和Zenodo之间的合作伙伴关系,其中非营利金融基金召集了6个组织来促进数字人文的财务弹性,全面重建公共访问提交系统,以及全球估计60%的钻石开放获取期刊使用OJS(Open Journal System,开放期刊系统)。2022年,IOI还宣布推出IOI网络采用基金,催化一种新的投资形式,以促进开放基础设施的实施、增长和可用性,从而推进科学研究和数据共享。 五、区域政策发展及其对开放式基础设施的影响 2021年通过的联合国教科文组织开放科学建议书标志着使“科学过程更加透明、包容和民主”的全球运动中的一个有意义的里程碑。虽然这种转变还有其他动机,但现在似乎是时候在这里分享非洲、欧洲、拉丁美洲和美国最近的开放科学和相关政策发展的概述,并反思开放数字研究基础设施的影响。 纵观这些地区,我们注意到用于推进开放科学的杠杆的多样性及其运作的规模。欧洲、非洲和拉丁美洲拥有强大的区域和大陆倡议和/或正在开发或实施的网络,拉丁美洲、欧洲和非洲之间有一些跨洲际的合作。欧盟最近的法律发展及其可能推动开放科学实践并可能使开放科学实践复杂化的潜力也值得注意。相比之下,我们不知道北美各地有重大的开放科学举措;因此,我们在这里的重点是美国,美国联邦政府是开放科学实践的最重要推动者之一。 另一个观察结果是,这一领域的范围和核心优先事项不同。在美国,虽然参与公平是最近政府促进公众获取研究成果的任务的一个组成部分,但它是次要的。公众获取研究成果也是拉丁美洲长期以来的优先事项和政策驱动力。在非洲大陆,获得执行研究处于更平等的地位,但这可能反映了在支持基础设施和获取基础设施方面投资不足的历史。与此同时,欧盟制定了一项雄心勃勃的开放科学政策,该政策侧重于利用数字和协作技术提供早期研究机会,但也嵌入了对整个数字生态系统具有潜在深远影响的技术政策举措中。 六、采购和信息技术治理对其开放式基础设施的影响 作为学术知识基础设施的建设者、促进者和用户,图书馆及其主办机构有责任为其用户提供具有成本效益、可持续且符合使命的服务。基础设施解决方案可以沿着开放性和社区责任的梯度进行定位,从完全开源、社区支持和治理的应用程序和服务,到利用开源应用程序的供应商支持的服务,再到完全专有的商业产品。这些应用程序和服务可以在本地采购和开发(在机构内部提供本地支持和管理),也可以从单个组织或社区的供应商处采购(通过联盟或其他协作努力)。 在可用的技术和服务中进行选择可能会涉及机构的采购和/或信息技术治理流程。为了支持IOI提高开放式基础设施采用率的使命,我们试图了解采购和IT治理流程是否以及如何帮助或阻碍研究机构采用开放式基础设施解决方案,并寻找机会确保公平和平等地考虑开放式基础设施选项。 七、未来信号 受Nesta《未来信号(2023)》报告的启发,团队思考近期的发展、主要矛盾及其对研究和学术领域开放基础设施的投资和采用的影响。 (1)人工智能对研究和学术领域基础设施的影响 随着人工智能(AI)模型、算法和工具的快速发展,以及它们在我们日常生活中日益普及,AI正在重新定义数字研究和学术交流基础设施,以及资助者、机构决策者和研究者的技术投资和采用实践。 ·重新定义研究和学术领域的基础设施 如今,AI工具可以轻易执行或协助许多当前由人类在研究和交流生命周期中执行的任务。它们可以创建和增强元数据、对图像进行分类、进行语言和模式之间的翻译、进行数据分析、改进同行评审等。同样,AI算法在研究人员和学者的研究和学术工作流程中的使用也越来越普遍,例如,自动转录服务用于转录研究访谈,或依赖于机器学习算法的图像分割工具。AI包括其模型、训练数据集,甚至它所依赖的硬件,正在成为研究和学术领域基础设施的一部分。 ·AI:构建更好开放研究基础设施的推动者 自动化为人们创造了机会,使他们能够将劳动集中在最适合人类的任务上,发挥他们的创造力、社交情感智能和复杂问题解决能力。 但存在一种重大风险,即资助者和决策者可能会将AI作为降低成本的策略,而不是作为用相同(或更多)资源实现更多目标并赋能人类工作者的方式。虽然我们承认这种风险,但将AI视为对人类劳动的增强而非替代,可以扩展开放研究基础设施所能实现的潜力。以开放数据共享平台为例,如果一个整理团队利用AI在数据提交过程中或之后立即进行一系列质量检查和元数据增强,他们不仅可以减少人类在乏味或重复任务上的投入,还可以腾出时间来进一步提高数据的可重用性,进行比时间允许的更深入的质量检查,为作者提供支持,或开发促进数据重用的创造性方法。 将AI视为对人类劳动的增强而非替代,可以扩展开放研究基础设施所能实现的潜力。 ·在基础设施决策中以原则和价值观为中心 AI在研究生产和交流中的潜在应用以及研究利益相关者对应用新兴AI工具的兴趣,也给研究执行机构带来了新的挑战。2023年5月的一项联合国教科文组织调查显示,只有不到10%的学校制定了关于在教育中使用生成式AI应用的机构政策或指导。虽然自那以后许多机构已经公布了相关政策,但鼓励在研究中负责任地使用AI的政策制定是否能跟上AI工具的扩散和演变,仍有待观察。特别是,这些工具中许多都具有黑箱特性,这使得验证生成式AI的输出变得困难。 随着AI成为开放研究基础设施的一部分,对于包括我们在内的开放基础设施协会中关心就我们所使用的技术做出明智决策的人来说,重要的问题是,我们如何理解技术选择的影响,以便做出更好的选择?当我们审视开放基础设施和伦理AI的对话时,我们看到存在的相似之处:对透明度、问责制和治理的考虑,对原则和价值观的讨论,以及对开放性是一个谱系的认识。随着AI成为研究基础设施的一部分,我们看到利用我们与基础设施服务提供者和采用者合作的经验来提供信息的机会,以帮助采用者做出更明智的决策。 (2)钻石开放获取模式的基础设施支撑 钻石开放获取(Diamond OA)在诸多方面是对一个旧现象的新命名——自20世纪80年代末以来,某种形式的完全免费的在线期刊就已存在。近年来,随着文章处理费商业模式的泛滥以及与之相关的出版公平性和差异性的讨论,人们对“无付费”出版形式的关注和紧迫感日益增强。 ·摆脱APC 资助者一直在重新考虑和发展他们对开放获取出版和APC的态度。钻石OA是诸如欧洲DIAMAS等大型项目的核心,DIAMAS是一个为期3年的、由欧盟委员会资助的项目,旨在汇集来自12个国家的23个组织,研究推进非营利出版模式(作为APC基础OA的对立面)的模型。诸如cOAlition S和Plan S等努力也汇聚于钻石OA和“出版、评审、策划”出版模式,以此应对科学出版领域的当前挑战。比尔及梅琳达·盖茨基金会最近宣布,他们将于2025年停止支持APC。由于资助者愿意为APC付费,以作为其使命的一部分,使资助的研究成果能够供公众获取,这推动了APC的通货膨胀和泛滥,我们看到这些运动正在回归OA运动的原始宣言,并在一个更加成熟的开放获取出版生态系统中进行。对APC的反感可能会使资金的天平重新偏向钻石OA及其基础设施;或者,它也可能推动其他生态系统(如预印本和同行评审)的进一步发展。 钻石OA被描述为将知识作为公共财富的公平手段,这呼应了21世纪初关于开放获取的原始宣言,并认识到一些以利润为驱动的动机已经使开放获取出版偏离了OA运动的初衷。钻石OA的未来迹象表明,我们正在重新审视OA运动的根源,并正视现实:当前的开放获取出版环境充斥着迅速膨胀和泛滥的APC,与OA运动早期所设想的免费获取理想相去甚远。我们密切关注并致力于推动更加公平的模型,投资于基础设施以及激励措施,以推动向这些模型更加一致的转变。 ·钻石OA面临的风险:以新基础设施投资为代价 现有的出版基础设施生态系统通常依赖于其他基础设施。这一系列幕后基础设施被称为支撑开放科学的“管道”基础设施。我们看到了一个重要机会,即加强已经支撑钻石OA的相互依赖的开放基础设施的“管道”,以构建一个能够与现实中的专有出版工作流程相竞争的强大开放工具链。商业出版商受益于成熟(通常是封闭的)的工作流程系统,这些系统能够支持全方位的出版活动,可靠地将内容从作者传递到读者。新工具和可见性往往能够吸引资金,而现有的开放基础设施则面临在没有大量资金注入的情况下进行增长、演进和投资于研发的挑战。作为一个热门话题,钻石OA面临的风险是以新基础设施的投资为代价,而忽视了那些几十年来一直支撑这些活动的现有基础设施。相反,投资于“管道”——即支撑钻石OA全生命周期的现有相互依赖的基础设施,将加强全球研究社区参与钻石OA运动的基础设施。 (3)数字主权的不同愿景及其对开放知识基础设施的影响 数字主权可以被定义为一个国家、地区或其他政治实体为其自身及其公民的利益而主张对其数字基础设施和数据进行控制的权利。从欧洲数据战略的发展到美国《芯片和科学法案》的出台,近年来,随着各国和地区希望获得对其数字基础设施和数据的控制和独立性,围绕数字主权的讨论日益增多、不断发展,相关政策也迅速出台。 ·数字主权的不同动机和愿景 虽然我们为数字主权提供了一个工作定义,但必须承认,在定义数字主权和接受数字主权的动机方面存在多种方法。这个概念被专制政府所接受,以便对其公民进行社会控制,也被更民主的制度所接受,以保护公民的个人数据和企业在信息经济中的经济利益。在拉丁美洲,对大数据公司和发达国家如何利用数据失去信任是推动数字主权的一个根本原因。数字公共领域的封闭及其被整合到由营利实体开发、维护、许可或出售的基础设施中,这些实体受其所在司法管辖区和用户所在司法管辖区的法规管辖,这使得地理因素变得比早期互联网先驱可能预想的更加重要。这种现象如果发展到极端,就有可能陷入“加拉帕戈斯综合症”,即基础设施变得分离、割裂,形成较小、孤立且不兼容的组成部分。 ·对全球数字研究基础设施的影响 我们好奇数字主权运动的地理“锚定”效应将对全球知识与研究的自由流动及其支撑基础设施产生何种影响。在考虑如何发展和维护可持续、可互操作且全球性的数字研究基础设施时,数字主权可能会影响这些技术在当地的部署方式。例如,云技术需要在本地服务器和云基础设施上运行,以便某个国家的研究人员能够使用。数字主权规定也可能对机构的采购政策产生日益增大的影响,进而影响研究人员和学者能够使用的技术。考虑到那些能够从全球数据源聚合信息而最有可能成功的解决方案,数字主权驱动的对数据共享方式和范围的更多规定与限制,可能会在这些解决方案的开发过程中带来额外的挑战和障碍。 ·开源技术:数字主权的推动者 开源技术因其能够“通过开放性、直接参与和保留实体的自主性来培养信任”,日益被视为数字主权的推动者。在一些地区和国家,政府正加大对开源技术发展的支持和投资,以推进该地区/国家的数字主权。例如,由德国联邦经济和气候保护部支持的主权技术基金,“支持开放数字基础设施的开发、改进和维护”,以确保其“为公共利益中的数字化提供可用性、可访问性和安全性”。特别是在欧洲,区域性和国家性的开源项目办公室数量正在增加。另一方面,在多数世界国家中,政府和私营部门缺乏大规模投资所需数字公共基础设施的资金或技术专长,因此,开源技术有可能为这些国家提供一种可行且成本效益高的替代方案,以替代大型科技公司或资源雄厚、实力强大的国家所提供的技术基础设施。所有这些都可以增加对构建当地能力以开发和维护开放基础设施的全球投资。 随着数字主权相关的发展持续进行,我们认为有必要重新审视追求开放数字研究基础设施的动机。如果实现研究和学术领域开放且公平的访问和参与确实是创建和部署这一基础设施的目标和动力,那么需要在建立对全球开放基础设施的信任方面进行大量投资。如果数据和数字基础设施的独立性和主权是目标和动力,那么就需要大力推动在使用开放基础设施建立联系和网络方面的协作与合作,使各国能够在保持各自控制领域的同时携手合作。
  • 《《2023年开放数据现状》发布》

    • 来源专题:数智化图书情报
    • 编译者:于彰淇
    • 发布时间:2023-11-21
    • 《2023年开放数据现状》报告全面概述了当前开放数据的状态和趋势,特别是在研究和学术界。以下是其主要内容的总结: 1. 关于调查: - 该调查旨在提供研究人员对开放数据的动机、挑战、看法和行为的详细见解。 - 这是Figshare、Digital Science和Springer Nature合作的项目,涵盖了来自不同专业背景的回应,其中大多数来自学术界。 - 该调查以多种语言进行,共收集到6091份有效回复,主要来自过去一年内发表或提交研究的个体。 2. 关键要点: - 支持缺口:相当数量的受访者(几乎四分之三)报告没有获得使其数据公开可用的支持。 - 多样化需求:回应表明,全球范围内需要更细致的研究数据管理支持,这种支持应根据不同的专业知识和地理位置来定制。 - 职业阶段影响:与成见相反,调查发现职业长度并不显著影响对开放数据的认识或支持水平。 - 认可问题:在过去八年中,一个反复出现的主题是研究人员感觉他们未获得充分认可,因为他们公开共享数据。 - AI工具使用情况:调查中加入了关于使用像ChatGPT这样的AI工具进行数据收集、处理和元数据创建的问题,显示大多数受访者知道这些工具但没有考虑使用它们。 3. 关键见解和建议: - 报告建议对开放研究数据的势头采取更细腻的方法,强调政策和实践并非一刀切。 - 它主张在政策之外满足研究人员的实际需求。 - 报告强调了数据管理计划(DMPs)的重要性,建议它们在组织和共享研究数据中发挥关键作用。 - 报告探讨了AI与开放科学之间可能的关系,暗示这是一个重要的合作开始。 - 最后,报告为学术界提供了推动更好的开放数据实践和支持系统的建议。 总体而言,《2023年开放数据现状》报告揭示了研究中开放数据的不断演变的格局,强调了在支持、认可和集成像AI这样的新技术方面的挑战。它强调了针对数据管理采取定制化方法的必要性,并指出了在不同研究社区和职业阶段之间承认多样性需求的重要性。 原文下载:https://digitalscience.figshare.com/articles/report/The_State_of_Open_Data_2023/24428194