《 预印本革命的下一步是什么——Nature's Take圆桌会议议题》

  • 来源专题:科技期刊发展智库
  • 编译者: 刘敬仪
  • 发布时间:2022-10-19
  •   在 Nature's Take 圆桌讨论会议中,Nature's 的工作人员交换了他们对预印本的意见。近年来,经过同行评审的开放获取文章数量激增已成为科学出版不可或缺的一部分,但这并非不存在任何问题。

      这项讨论涵盖了诸多领域,涉及的问题有预印本是否有助于科学民主化或导致公众对科学家失去信任。此外,本次会议区分了预印本和同行评审期刊之间的关系,并解决了一些常见的误解。期间还询问了不同领域的专家如何使用预印本,以及COVID-19如何改变了“游戏”规则。 当展望未来时,本次会议讨论预印本未来如何融入开放获取事业,甚至它们是否可以一起取代期刊。

相关报告
  • 《外媒:中国“机器人革命” 让印度等国更难腾飞》

    • 来源专题:数控机床——前沿技术
    • 编译者:杨芳
    • 发布时间:2016-05-18
    • 位于中国广东省的樱奥厨具(Ying Ao)看起来并不像一家未来的工厂。厂门上方的招牌已经褪色;车间里,油腻的地板上有一滩一滩的淤泥,浓重的金属粉尘(不锈钢抛光工艺的副产品)让人喘不过气。工人们拉着手推车走过时,空洞的、车棚一般的厂房里回响着巨大的哐当声。   广东省是中国制造业增长的发动机,去年创造了6150亿美元的出口额,超过了中国出口总额的四分之一。在广东省的这一地区,工人的薪资标准约为每月4000元人民币(合600美元)。据樱奥副总经理陈从汉介绍,由于厂内的劳动条件不是太好,这家为欧美厨房生产水槽的企业不得不支付双倍于上述标准的工资。因此,四年前该公司开始购买机器,代替越来越昂贵的人力。   如今,9台机器人在做着140名全职工人的工作。机械臂会从半成品堆中抓起水槽,把它们打磨得闪闪发亮,再把它们放在自动行驶的小车上,由其把这些水槽带到一个与电脑相连的摄像头前,进行最终的质量检验。   这家每天出口1500个水槽的企业在机器人上的投资超过300万美元。陈从汉表示:“这些机器比人力更便宜、更精确、更可靠。机器人从未毁掉一批产品。”他带着一丝苦笑补充说:“我希望未来能换掉更多人力。”   在整个中国南方沿海制造业地带,成千上万个与陈从汉所在工厂类似的厂家正在向自动化转型。这是一场政府支持的、由机器人带动的工业革命,其规模之浩大是世界从未见过的。自2013年以来,中国每年采购的工业机器人超过了其他任何国家,包括德国、日本和韩国等高科技制造业巨人。根据产业游说组织——国际机器人联合会(International Federation of Robotics,IFR)的说法,到今年底,中国将超过日本,成为全球运用工业机器人最多的国家。IFR总干事古德龙?利岑贝格尔(Gudrun Litzenberger)表示,中国颠覆性变化的速度是“机器人历史上独一无二的”。该组织的总部位于德国,这里是世界上一些顶尖工业机器人制造商的所在地。   中国技术转型仍有很长的路要走,目前中国每1万名制造业工人只有36部机器人,相比之下德国为292部,日本为314部,韩国则为478部。不过,中国已经在改变全球制造业的面貌。在这一过程中,中国正在引发更大层面的疑问:新兴经济体还能不能指望依靠传统的发展道路(自18世纪英国工业革命以来发达国家曾依赖过的道路)致富?抑或机器人将会接手曾经让数亿人摆脱贫困的许多职位? 樱奥厨具副总经理陈从汉:“这些机器比人力更便宜、更精确、更可靠。”   政府推动的“机器人革命”   中国在工业机器人上的大举投入,源自一个迫切的经济问题。从上世纪80年代以来,随着北京的共产党统治者向全球贸易打开大门,庞大而廉价的劳动力帮助中国成为全球最大的制成品出口国。迅猛的经济增长令数亿中国人摆脱了贫困,并随着劳动者从农村迁居城镇,转变了中国大片地区的面貌。然而,日益壮大的中产阶层和人口老龄化导致中国的薪资水平不断攀升,削弱了中国的竞争优势。中国的劳动力人口预计会从去年的10亿降至2030年的9.6亿,到2050年进一步滑落至8亿。这在一定程度上是已经在2015年正式废止的一胎化的结果。   近年中国的中央规划者一直在推动自动化,作为填补劳动力缺口的一条途径。他们承诺提供慷慨的补贴(由地方政府发放),为中国企业使用和建造机器人铺平道路。2014年,中国国家主席习近平呼吁掀起一场“机器人革命”,首先改变中国,进而改变世界。他在对中国科学院(Chinese Academy of Sciences)的一次讲话中表示:“我国将成为机器人的最大市场,但我们的技术和制造能力能不能应对这场竞争?我们不仅要把我国机器人水平提高上去,而且要尽可能多地占领市场。”   工业机器人价格大幅下降而能力稳步增加,加速了机器人在中国乃至世界各地的进军。管理咨询公司波士顿咨询集团(Boston Consulting Group)预计,未来10年,工业机器人及其配套软件的价格将下降20%,而它们的性能将以每年5%的幅度提升。   现年40多岁的创业家刘晖正在充分利用中国的机器人繁荣。2001年,他在广东佛山(一座拥有700万人口的工业城市)创办了自己的第一家工厂,制造廉价电风扇。随着企业逐渐壮大,他开始涉足正经的制造业,为中国家电品牌生产零部件。后来,由于看到了不断扩大的机器人市场中的机遇,他在2012年投身于新兴的机器人世界。如今,刘晖从供应商(如瑞士-瑞典跨国集团abb)进口机械臂,然后卖给中国制造商,并帮助把机械臂集成至客户的生产线。这是一项高度专业化的业务。他的大部分客户都是零部件制造商,他们为中国知名家电品牌——如生产空调、冰箱等家电的美的(Midea)、格兰仕(Galanz)——供应电动机及其他部件。 伊雪松机器人设备有限公司:机械手臂经过编程,以完成重复性的任务   过去一年,由于业务扩张速度非常快,以至于刘晖的工厂已经容不下正在装配的所有机械。他不得不在厂房外临时搭建棚子,存放用来支持一款2.3万美元的abb机器人的组件。“情况变化很快,”他说,“劳动力成本年年上升,年轻人不想像父母那样在生产线上工作,所以,我们需要机器人来替代他们。”   典型的中国工厂画面仍可在很多地方看到:长长的流水线上,成千上万的工人埋头操作缝纫机,或是将一个个组件插入印刷电路板。但这种制造模式正开始被一种更为混合的画面取代:只在几个关键点上需要人工操作的半自动化生产线。   与此同时,中国正在扶持本土机器人制造商的发展。去年9月,在上海上市的塑料工业机械生产商宁波弘讯科技(Ningbo Techmation)创立了一家子公司——广东伊雪松机器人设备有限公司(E-Deodar),其生产的机器人比ABB、德国库卡(kuka)或日本川崎重工(Kawasaki)等跨国公司的产品便宜20%至30%。伊雪松的工厂设在佛山,厂内有咖啡馆、放松区以及开放式生产线,看上去更像一家硅谷科技初创企业的办公室,而非传统的中国工厂。该公司35岁、头发竖起的技术总监张洪磊表示:“我们的全球竞争对手非常擅长制造机器人,但他们的成本较高,而且不是太懂本地客户的需求。”   张洪磊计划今年制造350台鲜艳的绿色涂装机器人,这些机器人将被用在塑料制品厂,每台售价在1.4万至1.8万美元之间;他希望3年后年产量达到3000台。“我们必须迅速行动,因为自动化是一项规模产业,”他说,“规模越大越好”。   国际机器人联合会的利岑贝格尔认为,购买了去年全球24万台工业机器人销量中的6.6万台的中国制造商,基本上仍偏爱购买国际品牌。但她预计这种情况将改变,尤其是在中国政府近年全力支持国内机器人产业的背景下。“他们发展得非常快,”她说。 佛山市顺德区经济和科技促进局副局长张鹏   在佛山市顺德区政府大楼(这栋宏伟建筑物的正立面用巨型石柱装饰,被当地人称为“白宫”)里,官员们正设法响应国家主席习近平主席的机器人革命呼吁。广东省已宣布,在2015至2017年向自动化产业投资80亿美元。为了响应中共节俭办公的号召,顺德区经济和科技促进局副局长张鹏在这座大楼里的办公室最近缩减了面积。但工业自动化方面的预算未受影响。张鹏说,机器人对于克服劳动力短缺、帮助中国企业生产出品质更好、竞争力更强的产品至关重要。他以中国官员中不常见的直率口吻警告称:“如果制造企业不升级,他们将无法生存。”   “与机器的赛跑”   中国政府对于在生产线上集成价格越来越低、效率越来越高的工业机器人的支持,对于面临全球经济疲弱和国内需求放缓的中国厂商来说是个好消息。但是,机器人革命的效益并不是全球平等共享的。从印度到印尼,从埃及到埃塞俄比亚,发展中国家长期以来一直希望效仿中国、以及更早实现经济起飞的日本、韩国和台湾:鼓励农业人口进入制造出口商品的低成本工厂,从而刺激就业创造和经济增长。然而自动化的崛起意味着,工业化为下一批新兴经济体带来的就业机会很可能少得多。“如今的低收入国家将不会有相同的可能性,即通过让农场劳动者进入工资更高的工厂来实现迅速增长,”美国投行花旗(Citi)和牛津大学(University of Oxford)的研究员在最近发表的关于技术变革的影响的报告《未来不同于过去》(The Future Is Not What It Used to Be)中得出结论称。   他们认为,不断上升的劳动力成本对中国而言是乌云中的一道曙光,因为它正在推动技术进步,就像18世纪英国工资上涨为世界第一场工业革命提供推动力一样。与此同时,常驻香港的花旗经济学家蔡真真(Johanna Chua)表示,亚洲和非洲一些工业落后的经济体面临着“与机器的赛跑”:竭力赶在被中国等工业化经济体日益壮大的机器人大军消灭之前,创造足够的制造业就业岗位。   现年45岁的印尼贸易部长汤姆?伦邦(Tom Lembong)是这个东南亚最大经济体的政府内部主张自由化和改革的领军人物,他意识到了这些风险。“很多人还没意识到我们正在目睹机器人的飞跃发展,”他表示,“这是一个令人担忧的大问题,我们要明白这场新的工业革命扑面而来的威胁。但是,我国的政界和商界精英仍然纠结于围绕20世纪甚至19世纪工业化模式的辩论。”   印尼等国已经遭遇了哈佛大学经济学家达尼?罗德里克(Dani Rodrik)所称的“过早去工业化”。它描述的趋势是,新兴经济体在收入远未达到发达国家水平之前,制造业便开始萎缩。尽管过去15年印尼经济迅速发展,但是其制造业占经济的比重在2002年便已见顶。分析师们认为,部分原因在于印尼未能投资于基础设施、贸易和投资政策不具竞争力,部分原因在于全球化。   罗德里克认为,印尼永远都不会出现中国或韩国所经历过的那种迅速增长。“传统上,制造业不需要太多技能,雇用大量人口,”他表示,“由于自动化的发展,制造业的技能要求显著增加,工厂运转所需的工人数量大幅减少。那些剩下的工人怎么办?他们成不了IT企业家和艺人;而如果他们在餐馆打工,他们的工资将远低于在工厂打工。”   每年有五家工厂离开印尼巴淡岛的这个工业园   他认为,机器人的普及使发展中国家更难搭上经济增长的“自动扶梯”。这对印尼每年新增的估计200万就业人口来说是个坏消息。印尼总人口2.55亿,其中40%的人口每日依靠不超过3美元度日。22岁的马哈米?贾耶?伦班拉贾(Mahami Jaya Lumbanraja)正在工厂比较集中的印尼巴淡(Batam)岛上找工作,他已经感受到了“过早去工业化”的影响。7个月来,他一直在巴淡岛(距离繁荣的新加坡仅20英里)寻找工厂职位,但至今没有碰上好运。身着褪色牛仔裤和灰色帽衫、脸上挂着可爱笑容的伦班拉贾称,尽管他有在禧玛诺(Shimano,生产自行车变速器和钓鱼用具的日资制造商)一年的工作经验,但他的经验不足以使他得到比初级工更高的职位,而求职者的人数远多于空缺岗位。“我能靠街头表演和帮朋友干建筑活赚点钱维持生计,但是我必须得到一份正式的工厂工作,才能存下足够钱,以后开一家自己的小店,”他表示。巴淡岛的工资水平——月均230美元左右——是伦班拉贾在其家乡棉兰市(Medan,位于苏门答腊岛)能赚到的收入的两倍。所以他觉得自己必须在巴淡岛坚持下去,一定要找到工作。   每天约有700名20岁上下的印尼年轻人到巴淡民都工业园(Batamindo Industrial Park)的社区中心找工作,伦班拉贾是其中之一。2月,一家日资电线厂在那里招聘80个岗位,但吸引了3000人前来申请。当时聚集的人太多,以至于工厂高管起初还担心是劳工抗议。   马哈米?贾耶?伦班拉贾是每天赴巴淡民都找工作的700名印尼人之一   巴淡民都工业园是新加坡投资者和印尼投资者的合资项目,1990年创立时得到两国时任领导人——李光耀(Lee Kuan Yew)和苏哈托(Suharto)的支持。该工业园的初衷是展示印尼工业化战略,结果却成为该战略各种失误的象征。近年来,平均每年有5家工厂离开该工业园,迁往其他国家。在2000年鼎盛时期,整个园区有8万名雇员,如今则只有4.6万人——尽管这里的工资只有中国广东省水平的三分之一至二分之一。   毕业于哈佛大学的伦邦在去年8月被任命为印尼贸易部长之前,在新加坡经营着一家自己的私募公司。他表示,印尼政府决心着手解决导致印尼经济凋敝的两大核心问题:基础设施薄弱和监管过度。   但一些人指出,现在改革为时已晚。中国在快速工业化时期,大力投资建设现代化的公路、铁路和港口等支持国内制造业发展的基础设施。相比之下,巴淡民都工业园总经理Mook Sooi Wah表示,巴淡岛以及印尼其他许多地方的基础设施“从上世纪70年代以来没有多大变化”。   根据国际机器人联合会2014年整理的最新数据,印尼的“机器人密度”实际上略高于中国,尽管鉴于中国政府在大力推动自动化,自那以来情况可能已经发生了很大变化。这种异常现象主要是由于中国的制造业劳动者队伍规模比印尼大得多,印尼政府至今没有推动工业自动化的计划,也没有提供任何支持。   印尼的监管流程与其基础设施一样过时。最近,由于一项旨在堵住非法采伐木材出口渠道的规则,一家造纸厂发运的一批正当货物被海关扣留在巴淡港。即便是热爱巴淡岛的人士也对诸如此类的问题愤怒不已。   德国制造业老将斯蒂芬?罗尔(Stefan Roll)上世纪90年代中国工业起飞时期曾在中国工作。他如今很享受在印尼的生活和工作,但他担心印尼正在错失“黄金机遇”,无法以足够高的效率在全球舞台上展开竞争。“当你和跨国公司打交道时,时间就是金钱,”罗尔在带着记者参观他在巴淡岛的新工厂时说道,该厂为雀巢(Nestlé)组装咖啡机。“但你必须有很好的道路和基础设施才能从事‘即时制造’。”   尽管没什么人怀疑发展中国家面临着深刻挑战,但不是所有人都这么悲观地看待这种两难困境。由于印尼、印度等国的工资水平比中国低很多,加上它们的人口相对年轻,一些分析师认为这些国家应该能够吸引劳动密集度较高的产业,比如服装生产,这些行业还不适合普及自动化。   “随着中国向产业链上方移动,它实际上在向东南亚和印度输送大量机遇。”汇丰(HSBC)驻香港的机器人行业分析师周正峰(Anderson Chow)表示。   波士顿咨询公司(Boston Consulting Group)的制造业专家哈尔?西尔金(Hal Sirkin)表示,从印度这样的经济体的视角看,“在他们有10亿人可以廉价地生产东西的时候”,搞自动化没什么意思,因为那会推高产品价格。他和其他一些技术乐观派认为,在中期内,自动化也将为新兴经济体开辟新的业务领域,缓解就业岗位被自动化取代的影响。   “我们认为你会看到更多的本地化,而不是更大的规模。”西尔金说道,“我可以开家工厂,改变软件,制造各种各样的东西,每批产量达到500万或是1000万件,而不是几亿。”   但牛津大学的就业和科技业专家卡尔?弗雷(Carl Frey)警告说,如果不提供更好的教育和培养更多技能,发展中国家将难以利用制造业进步所带来的好处。   “科技日益以技能为底子,”他说,“许多发展中国家并没有形成熟练工人群体,所以他们不是很擅长采用这些新技术。” 通过用机器人切割木板和在木板上打孔,尚品宅配这家工厂将生产率提高了40%   自动化的负面后果   中国本身也不能避免自动化的负面后果。中国14亿人口中仍有40%以上居住在农村,许多人生活贫困,他们从城市经济发展奇迹中受益很小。   但中国政府确信,促进尖端制造产业发展的好处将大于潜在就业岗位流失的损害。北京方面去年宣布了一项工业战略,即《中国制造2025》,其宗旨不只是提升中国工厂的技术实力,还要支持中国品牌在国际上的发展。   汇丰分析师周正峰表示,随着中国企业努力扩大出口以缓解国内市场放缓的冲击,它们很可能会更关注产品质量:“这往往意味着它们采用涉及机器人的更先进的生产流程。”   每年,企业收回机器人投资所需的时间——即“投资回报期”——都会大幅缩短,使自动化投资对中国小企业和工厂具有更大吸引力。以中国汽车制造业为例,花旗分析师的计算显示,2010年到2015年,焊接机器人的投资回报期已从5.3年降至1.7年。到2017年,投资回报期预计会降至仅1.3年。 佛山尚品宅配副总裁黎干   自动化并不是仅仅把更便宜、效率更高的机械臂投放到生产线上。尚品宅配家居股份有限公司(Shangpin Home Collection)生产和销售定制家具。该集团副总裁黎干表示,更大的机遇在于把车间第一线的机器人和来自客户以及自动化物流系统的实时数据融合到一起。   得益于机器人的使用,尚品2014年在佛山投产的工厂的产量比前一家工厂提高了40%,尽管雇佣人数减少了20%。今年晚些时候,尚品最新、最大的生产基地将会投产。尚品希望,仅仅增加一倍人手,便把产量增加3倍,办法就是使用更多机器人在车间里搬运物料,并帮助把产品装入发运集装箱。   为该公司不同规格的床、衣柜和其他定制家具所用的木板钻孔,过去是一道艰巨、有时还有危险的工序。如今,一名工人只需要捡起每块木板,扫描条形码,把木板放到一条传送带上,由其传递给机械臂。成品返回到另一条传送带上。中间的工序非常复杂:尚品不得不设计一种装置,以确保每块木板都排列正确,能够被机械臂抓到,木板钻孔要求预先编程并记录到一个条形码中,因为那些机器人尚不具备人工智能。黎干指出,人类管理和决策仍是至关重要的。“自动化只是一道技术工序,更重要的是我们对于如何最好完成工序的思考,”他说。“每次改动什么的时候,我们都会问:人还是机器人,用谁来做这个更有效?”   波士顿咨询集团预测,在中国、德国、日本、韩国和美国的推动下,到本十年结束时,由先进机器人承担的任务比例将从目前的8%上升至26%。这5个国家的机器人购买量将占到全球购买总量的80%。波士顿咨询集团的西尔金说,自动化的快速普及可以跟“人类学习曲线”和摩尔定律(Moore’s Law)之间的差别相提并论。摩尔定律认为,运算能力每18个月至2年就会提升1倍。“即便你很优秀,人的生产率充其量每10年能够提高1倍。”他估计,相比之下,研究人员可以让机器人每4年把生产率提高1倍。“复合增长率意味着,随着时间推移,这会产生很大的差别。”   随着中国等领先工业国制造出更多、更好的机器人,它们可以承担的任务将会增多。比如,长期以来,肉类加工一直被认为是机器难以掌握的一种技能,因为这需要细腻的手眼配合,以及对不规则形状肉块的处理。但西尔金观察到,机器人能够以比人高得多的效率把肉块上的肥肉剔掉,得益于成本更低、反应更灵敏的传感器。“用机器来做这个在经济上变得可行,因为你可以多省下3%或4%的肉,而那在一条生产线上是有很大价值的,你可以在生产线上快速移动。”   “有些事情,人比机器人做得更好,”他接着说。“但这类事越来越少了。”   本文作者为英国《金融时报》驻华南记者,曾任FT驻印尼记者   照片由Zeng Han和穆罕默德?法德利(Muhammad Fadli)提供   译者/何黎.
  • 《ChatGPT和生成AI对科研意味着什么?》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-03-31
    • 2022年12月,计算生物学家Casey Greene和 Milton Pividori开展了一项实验:他们邀请一名非科学家助理润色了三篇研究论文。该助理在几秒钟内就修改完成,每篇论文大约用了五分钟审阅完成。在一份生物学论文中,该助手还发现了公式参考文献的错误。除了实验过程存在些许不顺利,但论文最终的可读性更强,并且每篇论文成本不到0.50 美元。Greene 和Pividori 在2023 年1 月23 日的预印本论文中表示,该助理不是一个人,而是一种名为GPT-3的人工智能算法,该算法于2020 年首次发布。它是一种生成式人工智能聊天机器人工具,无论是创作散文、诗歌、计算机编程,还是编辑研究论文都非常擅长。 这类工具也被称为大型语言模型(Large Language Models, LLM),其中最有名的是GPT-3的一个衍生版本——ChatGPT。由于其免费且易于访问,在2022年11月发布后一举成名。 美国宾夕法尼亚大学的Pividori表示,此类工具将帮助我们提高研究人员的工作效率。 其他科学家表示,他们现在经常使用大型语言模型,不仅用于修改论文,还用于编写、检查代码等工作。冰岛大学计算机科学家Hafsteinn Einarsson表示,每天都使用大型语言模型,最早使用的是GPT-3,后来改用ChatGPT辅助编写PPT、改学生试卷和课程作业,还能将学生作为转为学术论文。此外,许多人将其作为数字秘书或助理。 但LLM也引发了广泛的讨论,包括回答内容的真实性、用AI生成内容冒充自己的创作等。《自然》采访科研人员有关聊天机器人(如ChatGPT)的潜在用途(尤其在科学领域)时,他们兴奋中夹杂着忧虑。科罗拉多大学医学院的Greene表示,如果相信这项技术具有变革的潜力,那么必须对此感到紧张。科研人员认为,很多方面都将取决于未来的监管指南对 AI 对话机器人的使用限制。 (1)流畅但不真实 有学者认为,大型语言模型很适合用来提高写论文或写基金的效率,但需要严格把关。伦敦软件咨询公司InstaDeep的工程师表示,大型语言模型就像一个进阶版的Stack Overflow(一个程序员互问互答的热门论坛),每天都可以用来写代码。 与此同时,研究人员强调,大型语言模型给出的回答从根本上说是不可靠的,有时候还是错的。这种不可靠已经深入大型语言模型的构建方式。ChatGPT和它的竞争对手都是通过学习庞大在线文本数据库中的语言统计模式来运作的,这些文本中不乏谣言、偏见和已经过时的信息。当大型语言模型接到提示(即 prompt,如Greene等使用精心组织的语言提出重写论文部分章节的要求)后,它们会一字一句地吐出看上去符合语言习惯的任何回复,只要能让对话继续下去。结果就是大型语言模型很容易给出错误或误导人的信息,尤其是那些训练数据很有限的技术性话题。还有一点是大型语言模型无法给出准确的信息来源。如果你让它写论文,它会把参考文献给你编出来。《自然-机器智能》在2023年1月发表的一篇关于ChatGPT的社论中写道,这个工具在事实核查或提供可靠参考文献方面是不能被信任的。 如果研究人员有足够专业知识发现问题或能很容易验证答案对错,比如他们能判断某个解释或对代码的建议是否正确,那么ChatGPT和其他大型语言模型就能成为真正意义上的助手。不过,这些工具可能会误导一些初级用户。如2022年12月,Stack Overflow临时禁用了ChatGPT,因为管理者发现一些用户上传了大量由大型语言模型生成的回答,错误率很高。 (2)缺陷如何解决? 有些搜索引擎工具能解决大型语言模型在来源引用上的不足,例如面向科研人员的 Elicit能先根据提问搜索相关参考文献,再对搜索引擎找到的各个网站或文献进行概括归纳,生成看上去全带参考来源的内容(但是大型语言模型对不同文献的归纳仍有可能不准确)。 一些科研人员表示,目前来看,ChatGPT在技术性话题上还没有足够且专业的训练数据,所以用处并不大。哈佛大学的生物统计学博士生应用ChatGPT后表示其很难达到所需的专业水平。 一些科技公司开始使用专业的科研文献训练对话机器人。2022年11月,科技巨头Meta 发布了名为Galactica的大型语言模型,用学术摘要进行训练,有望在生成学术内容和回答科研问题方面具备一技之长。但是,其测试版在被用户拿来生成不准确和种族歧视的内容后即被下架(但代码依旧公开)。 (3)安全与责任 如果不对输出内容进行把控,大型语言模型就能被用来生成仇恨言论和垃圾信息,以及训练数据中可能存在种族歧视、性别歧视等其他有害联想。OpenAI在决定公开发布 ChatGPT时,曾试图回避很多这些问题。OpenAI让ChatGPT 的信息库截至到 2021 年为止,不让它浏览互联网,还通过安装过滤器防止 ChatGPT 对敏感或恶意的提示做出回应。不过,做到这一点需要人类管理员对庞杂的有害文本进行人工标记。 一个学术团队发布了另一个名叫 BLOOM 的大型语言模型。该团队试着用更少的精选多语言文本库来训练这个机器人。该团队还把它的训练数据完全公开。研究人员呼吁大型科技公司参照这种做法,但目前不清楚这些公司是否愿意。 还有一些研究人员认为学术界应该完全拒绝支持商用化的大型语言模型。除了偏见、安全顾虑和劳动剥削等问题,这些计算密集型算法还需要大量精力来训练,引发人们对它们生态足迹的关注。进一步的担忧还包括把思考过程交给自动化聊天机器,研究人员可能会丧失表达个人想法的能力。 另一个不明确的问题是一些大型语言模型的法律状态,这些大型语言模型是用网上摘录内容训练的,有些内容的权限处于灰色地带。版权法和许可法目前只针对像素、文本和软件的直接复制,但不限于对它们风格上的模仿。当这些由 AI 生成的模仿内容是通过输入原版内容来训练的,问题也随之而来。 (4)强制诚信使用 因此,一些研究人员相信,给这些工具设立边界可能十分必要。当前关于歧视和偏见的法律(以及对 AI 恶意用途实施有计划的监管)有助于维护大型语言模型使用的诚信、透明、公正。与此同时,人们也在倡导大型语言模型的使用需要更透明的披露。学术出版机构(包括《自然》的出版商)已经表示,科研人员应当在论文中披露大型语言模型的使用。《科学》则更进一步,要求所有论文中都不得使用ChatGPT 或其他任何 AI 工具生成的文本。 这里有一个关键的技术问题:AI 生成的内容是否能被发现。许多科研人员正在进行这方面的研究,核心思路是让大型语言模型自己去“揪” AI 生成的文本。 2022 年 12 月,美国普林斯顿大学的计算机科学研究生Edward Tian推出了GPTZero,这是一个 AI 检测工具,能从困惑度和突发性两个角度分析文本。OpenAI 本身已推出了 GPT-2 的检测器,并在 今年1月发布了另一个检测工具。不过,这些工具中还没有哪个敢自称绝不出错,尤其是在 AI 生成的文本经过人工编辑的情况下。OpenAI表示,在测试中,其最新工具将人类写的文本误判为 AI 生成文本的错误率为 9%,而且只能正确辨认出 26%的 AI 生成文本。 与此同时,大型语言模型的开发者正在构建更大型的数据集,打造更智能的聊天机器人(OpenAI 拟在今年推出 GPT-4),包括专门面向学术或医疗领域的机器人。2022 年12 月底,谷歌和 DeepMind 发布了一篇预印本论文,提前预告了名为 Med-PaLM 的临床专业大型语言模型。这个工具可以回答一些开放式的医学问题,水平与普通人类医师相当,但仍有缺陷和不可靠的问题。美国加州斯克利普斯研究所主任 Eric Topol 表示,他希望将来整合了大型语言模型功能的 AI 能将全身扫描与学术文献中的内容进行交叉验证,帮助诊断癌症,甚至理解癌症。但他强调,这一切都需要专业人士的监督。 生成式 AI 背后的计算机科学发展迅速,基本每个月都会有新成果。研究人员如何使用这些工具不仅决定了它们的未来,也决定了人类的未来。 参考文献:1. Nature Portfolio. ChatGPT与科研:革新与隐患共存| 《自然》长文. https://mp.weixin.qq.com/s/qHYbDfDY8S47mXK65TsF_A. 2. Pividori, M. & Greene, C. S. Preprint at bioRxiv https://doi.org/10.1101/2023.01.21.525030 (2023). 3. GPT, Osmanovic Thunstr?m, A. & Steingrimsson, S. Preprint at HAL https://hal.science/hal-03701250 (2022). 4. Nature Mach. Intell. 5, 1 (2023). 5. Glaese, A. et al. Preprint at https://arxiv.org/abs/2209.14375 (2022). 6. Thorp, H. H. Science379, 313 (2023). 7. Kirchenbauer, J. et al. Preprint at https://arxiv.org/abs/2301.10226 (2023). 8. Singhal, K. et al. Preprint at https://arxiv.org/abs/2212.13138 (2022).