《AI的合法利用内容》

  • 来源专题:科技出版市场动态监测
  • 编译者: 崔颖
  • 发布时间:2025-03-05
  • 一、概述

    在最近的PubsTech会议上,有人提出,在没有通过许可协议具体授权的情况下,可以合法使用多少内容来训练人工智能系统。在考虑这个问题时,我们发现了一些反直觉的结果。

    二、背景

    生成式人工智能(GenAI)是一种可以通过分析海量数据集中的模式来创建新内容(文本、图像、音乐等)的人工智能类型。这些模型通常基于从网络上抓取的公开可用数据进行训练。在美国,开发者经常援引“合理使用(Fair Use)”版权原则来为这种训练辩护,声称其目的是特定的(训练),并且具有转化性(与原始用途不同)。

    实际上,法律立场复杂且不断演变,许多权利持有人及其代表,毫不意外地持相反观点。即使法律清晰度提高,不同的地理区域和司法管辖区也可能得出不同的结论。

    人工智能和版权法的法律复杂性超出了本文的范围。然而,对于学术出版商而言,存在一些特定问题。我们的产出中有一半是开放获取内容,而开放获取内容的设计初衷是可以被重复使用。无论是开放还是非开放,内容对后续使用的限制各不相同,例如,通常允许带有归属声明的非商业用途。

    三、有多少学术内容可以被利用?

    为了分析的目的,我们假设内容发布的许可条款对其用于训练AI系统的合法性有重大影响。因此,通过查看不同类型的许可比例,或许能够回答这个问题。

    图1 按许可分类的学术期刊产出比例

    上图显示了2023年学术期刊总产出中各种许可类型的占比:

    ·不到50%的内容没有开放许可或未指定许可。我们认为这是受版权保护的内容,权利归出版商所有。包括公共访问(Public Access,即青铜OA)产出,虽然这些内容可以在付费墙外获取,但并未赋予后续使用权。

    ·接近28%的内容是Creative Commons Attribution许可(CC BY)。这种许可允许在明确归属原作者的情况下无限制重复使用。这是开放获取倡导者常要求的许可类型。

    ·剩余22%的内容拥有更严格的Creative Commons许可。除了要求归属外,这些许可还施加了进一步限制,例如禁止商业用途(13%)或禁止衍生产品使用(9%)。

    ·只有极少量的内容完全没有限制(如CC0),或其他限制(如“Share Alike”许可)。我们的分析主要涵盖上述列出的内容。

    四、开放获取悖论

    开放获取最初被视为一种让学术内容在数字时代更具可移动性和适应性的方法。然而,在AI训练中的应用却面临实际挑战。

    即使是像CC BY这样宽松的开放获取许可,也要求归属声明。然而,生成式AI模型本质上会从它们处理的数据中剥离归属信息。尽管可以开发专门的AI来规避这一点,但大多数知名的大规模生成式AI工具并未做到这一点。因此,满足最基本的开放获取归属要求在实践中是不可行的。

    此外,传统许可通常明确界定允许的用途,而开放获取许可往往依赖于对“非商业用途”或“衍生用途”的解释,而这些解释可能因司法管辖区而异。

    相比之下,传统的受版权保护作品——通常由出版商控制——可以直接授权用于AI用途。出版商和AI公司已经在达成交易,绕过了开放获取合规的复杂性。

    五、结论

    关于AI背景下是否构成合法的“合理使用”,最终将由法院和立法者决定。定义和豁免将在不同司法管辖区之间有所不同。例如,英国对“公平引用(fair dealing)”的定义比美国的“合理使用”更为狭窄,但在某些条件下允许文本和数据挖掘。欧盟在其版权法中没有“合理使用”原则;其新兴的《人工智能法案》则着眼于透明度、问责制和数据治理的要求。此外,即使系统训练可能是允许的,结果的应用仍可能构成侵权。

    无论法律细节如何,AI公司是否可以直接从出版商那里获得内容许可?

    对于出版商持有版权的受版权保护内容,答案是肯定的。重用权由许可持有者授予,而许可协议已经是出版业的一部分。学术出版商现在正在向科技公司授权内容。一旦达成协议,被许可方就可以继续执行约定的用途。唯一的挑战在于公众认知方面,尤其是在作者不支持其作品用于AI训练的情况下。

    然而,生成式AI的兴起揭示了一个数字时代的讽刺:定义开放获取的“开放性”可能反而阻碍其在当今最具变革性技术之一中的应用。与此同时,传统的“封闭”许可仍然是AI开发者的一条更顺畅路径,尽管需要付出一定成本。出版商和作者面临的挑战是如何应对这一悖论,确保他们的作品在未来由AI驱动的世界中既受到保护又具有影响力。

  • 原文来源:https://www.deltathink.com/news-and-views-how-much-content-can-ai-legally-exploit
相关报告
  • 《使用修改的花算法利用MPP估计提取PV模块参数》

    • 来源专题:可再生能源
    • 编译者:pengh
    • 发布时间:2019-06-04
    • 光伏(PV)模块的建模对于诸如监视系统或故障检测系统的许多应用仍然是一个严重的问题。因此,已经提出了PV电池的几种等效模型,着名的所提出的模型被称为单二极管模型(SDM)和双二极管模型(DDM)。每个模型都拥有必须定义的未知参数值。在本文中,提出了两个相当于PV电池的电气模型,这些模型具有必须识别的未知参数。修改后的花算法(MFA)是一种受自然界启发的优化算法,该算法用于提取两种模型的最优参数值。所提出的算法模拟了花粉转移的途径以帮助在自然界中产生植物,换句话说,花粉可以通过许多方式来繁殖植物,这些方式可以被开发成强大的优化算法。为了评估所提出的算法,使用了几个实验数据,这些数据是在室外条件下获得的并且包含各种I-V曲线,这些I-V曲线取自三种PV电池技术,即单晶,多晶和非晶。此外,将模拟结果与两种模型的实验数据进行比较。此外,应用所识别的SDM参数来预测最大功率点(MPP)处的电流,电压和功率,然后将其与从并网光伏系统(GCPVS)的实际数据获得的MPP进行比较。 ——文章发布于2019年6月1日
  • 《华硕开设首个AI智能工厂》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2022-11-02
    • 近日,华硕宣布其首个AI智能工厂正式启用!据悉,该工厂采用了多种 AIoT 技术,包括 3D 数字孪生、AR、用于工厂物流的自主移动机器人 (AMR) 以及人工智能驱动的缺陷检测系统。 据官方介绍,该工厂已实现了数字化,可以从中央数据仓库平台跟踪和管理生产过程的每一步。该工厂融合了许多物联网 (IoT) 和机器对机器 (M2M) 通信技术,提高了产品质量,同时也创造了一个智能和有弹性的制造环境;人工智能驱动的双直插式封装 (DIP) 器件缺陷检测系统将提高组装质量,提高效率和精度标准;先进的预警系统将有助于防止错位、倾斜等失误,减少返工工作量。此外,AR 眼镜的引入将为一线操作人员提供随时随地访问数据的机会。 智能工厂如火如荼,众多巨头积极布局 近年来,全球各主要经济体都在大力推进制造业的复兴。在工业4.0、工业互联网、物联网、云计算等热潮下,全球众多优秀制造企业都开展了智能工厂建设实践。作为IT行业的龙头企业,华硕推行的智慧工厂建设中,也能看到诸多信息技术的体现。 智慧工厂的建设为何如此重要?首先要知道,当前我国制造企业面临着巨大的转型压力,一方面是人工劳动成本攀升,同行竞争之下的产能对拼,客户个性化需求日益增长等因素影响,迫使制造企业从低成本竞争策略转向建立差异化竞争优势。 另一方面,社会老龄化趋势越来越明显,制造企业面临着招人难的问题,尤其是具备专业技能素养的人员更是难以寻觅。如果能够通过推进智能工厂建设来实现“减员增效”,无疑对工厂未来的运营更加高效有力。 如今,我国汽车、家电、轨道交通、食品饮料、制药、装备制造、家居等行业的企业对生产和装配线进行自动化、智能化改造,以及建立全新的智能工厂的需求十分旺盛。随着物联网、预测性维护、机器视觉等新兴技术迅速兴起,为制造企业推进智能工厂建设提供了良好的技术支撑,越来越多巨头布局于此,率先打造出智能工厂建设的样板。 以海外巨头为例,西门子的安贝格电子工厂实现了多品种工控机的混线生产;施耐德电气实现了电气开关制造和包装过程的全自动化;发那科实现了机器人和伺服电机生产过程的高度自动化和智能化,并利用自动化立体仓库在车间内的各个智能制造单元之间传递物料,最高可以实现720小时的无人值守;三菱电机采用了人机结合的新型机器人装配产线,实现从自动化到智能化的转变,显著提高了单位生产面积的产量。 再看国内巨头,海尔在佛山的滚筒洗衣机工厂,可以实现按订单配置、生产和装配,采用高柔性的自动无人生产线,广泛应用精密装配机器人,采用MES系统全程订单执行管理系统,通过RFID进行全程追溯,实现了机机互联、机物互联和人机互联;小米也将其智能工厂建设在了北京市,该工厂是高度智能化的“黑灯工厂”,设备大部分都是小米自研。据悉小米昌平智能工厂将与亦庄一期工厂,形成“研发+量产”的产业协同效应,全面展开智能制造布局。 建设智慧工厂,哪些环节最重要? 目前关于智慧工厂的定义各有说法,在相关资料中指出,智慧工厂基本特征主要有制程管控可视化、系统监管全方位及制造绿色化三个层面。 “制造过程管控可视化”,是为了让原料管控及各个流程,均能实时展示于控制者眼前,减少因系统故障造成偏差。而所有流程的相关数据,均可保存在数据库中,以便管理者后续调用或搜寻数据进行规划。也可以根据现有的可视化诗句,对生产线系统的现况进行调整维护等。 “系统监管全方位”,顾名思义,就是通过物联网概念、以传感器做链接使制造设备具有感知能力,系统可进行识别、分析、推理、决策、以及控制功能。 在“制造绿色化”方面,其实也是现在广大工厂老生常谈的问题。除了在制造上利用环保材料、留意污染等问题以外,还要跟上下游厂商间联系,从资源、材料、设计、制造、废弃物回收到再利用处理,以形成绿色产品生命周期管理的循环。 那么的打造智慧工厂,里面究竟会用到哪些技术呢?最重要的其中一项,就是“无线感测”技术,无线感测器将是实现智慧工厂的重要利器。不管是传感器,还是仪器仪表都开始呈现智能化发展,能够更快更灵活的帮助管理者了解和控制工厂里的一切内容。 还有一项很重要的技术——无线通信。工厂无线通信不同于移动设备之间的通信,它是通过支持设备间的交互与物联,提供低成本、高可靠、高灵活的新一代泛在制造信息系统和环境,常见的通信标准包括蓝牙、Wi-Fi、GPS、LTE以及WiMax等等。 此外,还有智慧工厂建设中最不可或缺的一项——云端部署以及网络化。随着智慧工厂制造流程连接的嵌入式设备越来越多,通过云端架构部署控制系统,无疑已是当今最重要的趋势之一。在工业自动化领域,随着应用和服务向云端运算转移,资料和运算位置的主要模式都已经被改变了,由此也给嵌入式设备领域带来颠覆性变革。 万亿市场等待开发 众所周知,制造业是中国实体经济的根基,目前全国共有327万家制造企业,吸纳了1.05亿人就业,占总就业人口的27.3%,居各行业之首。要想从“制造大国”变为“制造强国”,还需要实现人工智能与制造业的深度融合发展。 数据统计显示,在2020年中国智能工厂市场规模已经达到了8560亿元。根据当前各行业建设智慧工厂的热情及扩张速度,预计未来几年中国智慧工厂行业仍将保持10%以上的年均增速,到2025年,中国智慧工厂行业市场规模有望超1.4万亿。 毫无疑问,智慧工厂是现代工业、制造业的大势所趋,是实现企业转型升级的一条优化路径,未来市场必然是前景广阔且不容忽略。