《科技热点 | 你用AI写的论文,已经被“盯”上了!【中国科讯】》

  • 来源专题:数智化图书情报
  • 编译者: 于彰淇
  • 发布时间:2024-01-22
  • “太不像话了!学生用人工智能生成的期末论文糊弄我。”近日,上海某高校教师在社交媒体上“吐槽”自己遇到的新难题——一些想偷懒的学生开始用人工智能技术完成论文。

    以ChatGPT为代表的生成式人工智能技术(AIGC)横空出世,似乎为人们写论文提供了新帮手。从提供选题到文稿润色、从统计分析到图表制作……其功能之强大,几乎覆盖了学术论文写作过程的方方面面。面对ChatGPT等工具的潜在风险,争议随之而来。不少人质疑,人工智能到底能不能用于辅助学术论文写作。有人认为,它只是提高科研效率的工具。有人则对此持审慎态度,认为容易引发大规模的学术诚信问题。

    人工智能技术在论文写作中的应用程度如何?技术应用的边界在哪里?如何对这一技术进行有效治理?记者对此进行了深入采访。1AI生成的文本“非常水”有多少人尝试过用人工智能技术写论文?去年《自然》杂志对全球博士后的一项调查发现,约有三分之一的受访者使用人工智能聊天机器人来优化文本、生成或编辑代码、整理文献。

    当记者尝试在社交媒体上搜索“AI”“论文”“写作”等关键词,五花八门的AI论文写作指导教程映入眼帘。其中大部分宣称能够教会用户在几分钟内通过几个简单的步骤,生成一篇几万字的“优质”论文。这些教程的浏览量最高已达数百万。

    AI真的能生成一篇完整的“优质”论文吗?记者按照教程开始了尝试:“请提出与民族志纪录片有关的论文选题。”几乎无需等待,几个看起来很“靠谱”的选题就出现在对话框里。某大语言模型生成的民族志纪录片论文选题。网页截图

    “请就某一选题生成写作大纲。”几秒后,7个像模像样的章节全部生成完毕。“请就提纲中某项内容,详细描述2000字。”重复几次操作后,一篇几万字的“论文”很快就完成了。但记者浏览后发现,其生成的段落中,存在大部分重复且言之无物的内容。

    除了说“车轱辘”话,某985高校人工智能专业硕士研究生温睿还发现了此类论文的行文特点:“一般是先写一句话,然后进行分条论述。当老师看到这样套路化的内容就会猜测,这类文章很大程度上是人工智能写的。”

    文章开头那位教师的经历印证了温睿的发现。“这样的论文看似条理清晰、层次丰富,但实际上每个层面的内容都很少,而且非常空洞。我马上就怀疑是AI生成的。”该老师说。

    不少期刊编辑、审稿人也发现了同样的问题。

    某人文社科期刊审稿人徐彬向记者透露,用AI写论文的关键在于提示词。如果提示词选用的不恰当,就极有可能得到一篇套路化的文章。他目前已经收到过五六篇“一眼就能看出来”用AI写的稿子。

    “这些文章的共同特点就是非常水。虽然它生成的语言连贯性不错,但是缺乏深度,创新性也不强。”对此,徐彬略显无奈,“综述类文章是使用AI的重灾区,但目前期刊还缺乏相关的评价标准和处理机制。”2伪造数据集更具隐蔽性在清华大学人工智能国际治理研究院副院长梁正看来,论文核心评价标准包括作者发挥的创造性、对论文的贡献程度。一篇大部分由AI生成且隐瞒使用情况的文章,既没有作者智力的贡献,也不符合科研诚信的要求,属于学术造假。

    AIGC造成的学术造假还发生在数据领域。记者在采访过程中,多位业内专家提到了伪造数据集问题。相比直接的文本生成,这一方式更具有隐蔽性。

    GPT-4的ADA功能是一种结合了计算机编程语言Python的模型,可以执行统计分析和创建数据可视化。梁正向记者讲述了一则真实的案例:国外某机构研究人员先是要求GPT-4 ADA创建一个关于圆锥角膜患者的数据集,后又要求它编造临床数据,用以支持深板层角膜移植术比穿透性角膜移植术效果更好的结论。但真实的临床数据证明,两种手术效果并无明显差别。

    “针对某个问题,提出方法来解决,并通过实验来证明方法的可行性——这是专业论文的常用模式。人工智能不能做实验,哪怕它给的实验数据再理想,也都是虚假的。”温睿认为,虚假的数据背离了科学研究的真正意义。

    除了数据处理,更多人使用AIGC来解释概念。温睿发现AIGC生成的概念简洁明了,查重率也非常低。但当记者询问这些概念是否正确时,温睿显得有些迟疑:“我也没有把握,通常默认它是对的。”

    为了验证AIGC给出答案的准确性,记者就一些新兴概念提问,但它给出的答案往往和真正概念毫不沾边。当记者让AI生成5篇某领域的重点参考文献,它又胡编乱造了5个不存在的作者和不存在的文献。以上作者和论文并不存在。网页截图

    在人工智能领域,描述AI“一本正经地胡说八道”的专业名词是“AI幻觉”。哈尔滨工业大学(深圳)特聘校长助理、教授张民解释,AI幻觉是指AI会生成貌似合理连贯,但与输入问题意图不一致、与现实或已知数据不符合或无法验证的内容。这多是由于AI对知识的记忆不足、理解能力不够、训练方式固有的弊端及模型本身技术的局限性所导致。

    “如果不警惕AI幻觉,很有可能损害科学研究的真实性和客观性。”梁正表示,AI生成的错误信息一旦被广泛传播,不仅会造成“学术垃圾”泛滥,还将影响学术生态的良性发展。3一场你追我逃的“猫鼠游戏”一项新技术的出现,对于社会的发展往往是把双刃剑。虽然人工智能技术存在种种隐患,但其在图文创作、数据处理等方面的强大能力已被大多数人认可。“归根结底,我们认为AI将增加人类的智慧,而非取代人类。其使用应在人类监督之下,并将道德因素考虑在内。”施普林格·自然集团发言人说。

    推动AI向善发展,需要借助行之有效的技术手段。值得注意的是,AI生成的论文并不能被查重工具检测出来。因此,国内外都在探索研发专门针对AIGC的检测工具。

    从原理看,AIGC检测技术是在“用AI打败AI”。同方知网数字出版技术股份有限公司副总经理柯春晓介绍:“人类的创作往往是随机且富有灵感的,而接受过大量文本训练的AI已经形成了生产文本的‘固有’范式,倾向于使用‘一致’的结构和规则,因此具有更高的可预测性。”AIGC检测的核心就是依托海量的文本和数据样本,识别出人类和AIGC工具在平均句子长度、词汇多样性和文本长度等方面的不同点,从而揪出AI论文“枪手”。

    一些期刊出版机构通过检测工具发现了AIGC代写论文的痕迹。“从去年7月底到现在,我们发现涉嫌AI写作的论文数据每个月都在上升,大约有六七十篇的文章疑似使用AI的程度超过了50%。”《中华医学杂志》社有限责任公司新媒体部主任沈锡宾介绍。

    沈锡宾向记者展示了检测过程:一篇论文经过检测系统后,会显示疑似AI生成占全文比重,相关疑似段落也会被标红。但记者注意到,和传统的查重报告单明确标注重复痕迹不同,AIGC检测报告单只是指出某些文本AIGC的“置信度”,并不能回答为什么是这个值。

    “这使得报告单往往只起到参考和警示作用。”柯春晓说。

    目前,人工智能大模型正在以“周”为单位进行迭代升级。如何适应不断升级的技术,是摆在AIGC检测工具面前的一道必答题。

    作为使用者的人类本身也在不断“进化”。“类似人们逃避查重的方式,如果人们了解到AI检测的方式,也可以重新组织相关内容,对AI生成的文本进行人工润色。这样很可能就检测不出来了。”沈锡宾说。

    作弊与反作弊的过程,实质上是场“猫鼠游戏”。只要技术不断升级,两者间的博弈就不会停止。目前,AIGC检测技术仍处在萌芽期。如何对AI生成的虚假图片、虚假数据进行识别仍是难点。因此,人们引入智能检测技术的同时,也要建立人工审查机制。

    “审稿人要当好‘守门人’,发挥同行评议的作用,仔细甄别判断论文的数据是否和认知存在偏差。出版机构也可以要求作者提供原始数据,多管齐下,确保科研诚信。”沈锡宾说。4技术向善要他律更要自律加强技术治理的同时,各方都在翘首以盼,期待达成某些共识以及相关政策尽快出台。“教育、科研、出版各方都很关注AIGC使用的边界,期待对合理使用AIGC形成一个共识性规范。”知网技术专家呼吁。

    其实,早在去年初,中国科学技术信息研究所(以下简称中信所)就牵头爱思唯尔、施普林格·自然、约翰威立等国际知名出版集团和科研信息分析机构,在广泛调研并梳理业内相关研究和探索工作的基础上,完成了中英文版的《学术出版中AIGC使用边界指南》(以下简称《指南》),并于去年9月20日在国内外同步发布。

    去年12月21日,科技部发布的《负责任研究行为规范指引(2023)》(以下简称《指引》)更是受到了业内的广泛关注。

    《指引》和《指南》就如何负责任地使用AIGC,解答了令科研工作者、期刊编辑、审稿人困惑的一些问题。

    首先是披露问题。《指引》提出,使用生成式人工智能生成的内容应明确标注并说明其生成过程,确保真实准确和尊重他人知识产权。《指南》中更是提供了声明的模板,供科研人员参考。

    对于一些人想用AIGC投机取巧的行为,《指引》明确提出,不得使用AIGC直接生成申报材料;《指南》规定,AIGC不应该用来产生研究假设、直接撰写整篇论文文本、解释数据、得出研究结论。研究人员使用的数据必须是研究人员进行实验并收集所得,如使用AIGC提供的统计分析结果需进行验证。

    随着AIGC的使用边界不断清晰,越来越多的出版机构达成共识,制定了使用规范。施普林格·自然集团发言人介绍说,他们目前已经明确了有关作者身份和图像方面的规定。例如,人工智能不能担任作者,真正作者如使用大语言模型须加以透明描述,AI生成的图像通常不能用于发表等。

    “《科学》杂志在去年1月份发布的政策是禁止使用任何AIGC工具。而11月16日他们更新了投稿规则、放宽了限制,表示只要进行了适当披露,使用工具是可以接受的。”中信所博士郑雯雯说道。

    “《指引》覆盖较为全面,对AIGC的使用总体呈现出平衡包容、敏捷治理的态度,而非一味禁止。这也说明治理的目的并不是阻止科研工作者使用新一代人工智能技术,而是让科研工作者能够负责任地去使用。”梁正提到,在政策制定的行为框架之下,还要关注学科差异问题。“使用AIGC可能因学科的不同而有所差异,其伦理问题也要根据学科特点细化。”

    例如,在自然科学领域,AIGC的强大功能更多体现在数据处理领域,如果失范使用,往往难以发现。而对于人文社科领域,直接使用AIGC生成内容的痕迹非常容易被发现,尤其是在高水平的研究当中,优劣之分更为明显。

    “因此,对于更加注重文字表达、数据资料支持的学科,比如企业管理、理工科、医学等,需要防范产生虚假的数据集或论证材料。”梁正说,“对AIGC使用的披露程度、疑似度的数据指标等,都需要学术共同体进一步探索,来推动形成广泛共识。”此外,尽管国家出台了相应的规则,但从外部监督到行业自治还需要一个过程。AIGC的使用涉及包含研究人员、出版机构、相关行业组织、政府等方方面面。如何厘清各方关系,各司其职是关键。“简单说,就是出了问题,谁来查?有没有能力查?”郑雯雯强调。

    记者了解到,中华医学会杂志社在今年1月9日公布了其对于AIGC技术使用的有关规定。其中不仅涉及了作者要遵守的细则,还提出了查处方式——经编辑部研判的违反AIGC使用的情形,将直接退稿或撤稿;情节严重者,将列入作者学术失信名单。

    “我们下一步的目标是把存在问题的文章作一个归纳总结,进一步摸清AIGC使用的规律,为科学治理积累经验。”沈锡宾说。

    “尽管新兴技术有着潜在风险,但也有着无可比拟的优势,不宜一味封堵,而是要做好引导、合理合规地使用新技术。”郑雯雯表示,归根到底,科学研究的主体是人。如果心中的那杆“秤”倾斜了,即使再完善的监管政策、再高端的检测技术,也难以抵挡学术不端的侵袭。

    梁正也强调,作为科研诚信的第一责任人,科研人员一定要保持严谨的学术态度,关注研究领域的真问题,坚守学术研究的基本原则,如原创性和透明性;明确认识到ChatGPT等工具的潜在风险,避免使用不当而造成学术不端。

    “科研诚信和伦理是科研的生命线,科研人员一定要存敬畏、有底线。一旦在这方面有瑕疵,职业生涯或将葬送。”梁正提醒。

  • 原文来源:https://mp.weixin.qq.com/s/KezYMCMKQ2wQvAtTkxs6zg
相关报告
  • 《科技热点 | 2024,展望这些科技大事!【中国科讯】》

    • 来源专题:数智化图书情报
    • 编译者:于彰淇
    • 发布时间:2024-01-11
    • 2024年,全球科技领域有哪些值得期待的大事?仰望浩瀚宇宙,人类朝着探索星辰大海的梦想持续迈进,探月等太空探索活动精彩纷呈;科技改变生活,人工智能技术进一步赋能各行各业,加速融入社会方方面面;应对气候挑战,绿色科技的开拓和应用日新月异,助力全球可持续发展。 访星探月问苍穹月球仍是今年太空探测的重点。 美国航天局计划不早于今年11月执行“阿耳忒弥斯2号”载人探月任务,4名宇航员将搭乘美国新一代登月火箭“太空发射系统”及“猎户座”飞船进行绕月飞行;美国航天局新一代月球车“挥发物调查极地探索车”拟于年底在月球南极着陆,执行为期100个地球日的探索月球水冰资源任务。 中国探月工程嫦娥六号任务计划开展人类首次月球背面采样返回。为顺利完成月球背面航天器与地球间的通信,新研制的鹊桥二号中继通信卫星拟于2024年上半年发射。 日本宇宙航空研究开发机构的小型登月探测器SLIM已于去年底进入环月球运行轨道,定于1月20日在月球表面着陆。 私人企业也争相将探测器送上月球,竞逐“首家登陆月球的私企”头衔。美国航天机器人技术公司计划1月借助美国联合发射联盟公司新研发的“火神半人马座”火箭发射“游隼”月球着陆器。美国“直觉机器”公司拟于2月中旬发射Nova-C月球着陆器。 深空探索领域,定于10月发射的美国航天局“欧罗巴快帆船”探测器将对木星卫星木卫二进行详细的科学调查。科学家预测,木卫二的冰壳下存在巨大的咸海,可能含有维持生命所必需的物质。 同样值得期待的航天项目还包括美国太空探索技术公司新一代重型运载火箭“星舟”试验发射、美国波音公司新一代载人飞船“星际客机”首次载人试飞、美国“火箭实验室”公司的金星探测任务等。此外,美国航天局和日本宇宙航空研究开发机构计划今年夏天发射首颗木制外壳卫星。 人工智能广赋能从自动驾驶到个性化推荐,从金融分析到法务咨询,人工智能正赋能各行各业,加速融入我们的生活。 以ChatGPT为代表的生成式人工智能已带来颠覆性体验,和人类聊天、撰写论文、编程写代码、创作音乐均“不在话下”。美国OpenAI公司计划今年发布下一代人工智能模型GPT-5;谷歌公司人工智能模型“双子座”的最新版本也备受关注。 英国“深度思维”公司人工智能工具“阿尔法折叠”的新版本定于今年发布,该工具能以原子精度模拟蛋白质、核酸和其他分子之间的相互作用,助力药物研发。测试人工智能能否用于肺癌早期诊断的临床试验也有望在今年得出结果。 量子计算与超级计算机的发展将为人工智能提供强大支撑。今年,量子计算有望从理论走向实际应用。多台算力强大的超级计算机也将投入使用,如欧洲首台百亿亿次超级计算机“木星”,美国的百亿亿次超级计算机“极光”和“酋长岩”。全面模拟人脑网络的超级计算机“深南”定于4月在澳大利亚投用,这台神经形态超级计算机每秒能进行228万亿次突触操作,与人类大脑的估计操作次数相当。 人工智能在提高效率和便利性的同时也带来监管挑战,不少国家和地区已陆续出台相关法规。联合国“人工智能高级别咨询机构”定于今年年中发布一份最终报告,为人工智能的国际监管制定指导方针。 同样带来伦理风险和治理挑战的还有脑机接口技术。美国企业家埃隆·马斯克旗下的脑机接口公司“神经连接”今年将开始为人类志愿者植入脑机接口设备。在“人工智能+”时代,脑机接口与人工智能的融合值得期待,也引发担忧。 绿色科技成潮流世界气象组织数据显示,2023年是有记录以来最热的一年。然而,这一纪录2024年就可能被打破。美国《科学》杂志网站3日发布今年值得关注的十大科学主题,位列第一的就是厄尔尼诺现象从去年延续至今年,可能加剧气候变化,使全球平均气温首次超过工业化前水平1.5摄氏度。 因此,绿色科技的拓展和应用格外受到重视。据国际能源署预测,2024年全球可再生能源发电量将首次超过总发电量的三分之一。 中国在大力开发新能源方面走在世界前列,国家能源局2023年年底的最新数据显示,中国可再生能源占全国发电总装机已超过50%。中国还与许多发展中国家分享经验技术。据报道,在南非北开普省,由中国企业承建的红石100兆瓦塔式光热太阳能项目预计2024年年初试运行。 在清洁电力应用场景,交通领域已掀起电动汽车热潮,而在2024年,电动垂直起降航空器有望成为新亮点。在将于1月9日开幕的美国拉斯维加斯消费电子展上,韩国现代汽车集团计划展出“空中的士”概念产品。巴西航空工业公司去年宣布建造“飞行车”工厂,并计划今年试飞。电动垂直起降航空器此前已有一定程度发展,上述昵称显示了人们对它寄予的厚望。 直接从大气中分离二氧化碳的碳捕集与封存技术,代表了人类应对气候变化的另一个努力方向。今年6月,“碳捕集峰会”将在荷兰召开,相关业界人士将集中探讨这类技术的发展模式和经济价值。 今年的联合国气候变化大会将于11月在阿塞拜疆首都巴库举办,各方将继续就如何采取切实行动、共同推动全球绿色低碳可持续发展等议题展开讨论。
  • 《科技热点 | 富商找回被拐25年儿子,AI在背后发挥了什么作用?【中国科讯】》

    • 来源专题:数智化图书情报
    • 编译者:于彰淇
    • 发布时间:2023-12-11
    • 近日,河北邢台富商解克锋找回被拐25年的二儿子谢清帅一事,连续多日霸榜各大平台热搜。让人意想不到的是,谢清帅被寻回,背后的核心技术竟然是人工智能。 近几年人工智能发展迅猛,使得AI加持的新兴刑侦技术在寻亲行动中扮演着越来越重要的角色,让寻亲之路不再遥远。那么,AI在寻亲过程中具体发挥了哪些作用?到目前为止,又有哪些成功案例? AI技术助力富商寻子 距离上一个被拐儿童被找回不到两个月,来自北京的人工智能公司“格灵深瞳”再次协助警方,寻回河北富商之子解清帅。 至此,历时25年的漫长寻亲路之后,解克锋夫妇终于迎来“上岸”之日。12月1日下午,在公安人员的见证下,解克锋与离散多年的儿子紧紧相拥,一家人终于得以团聚。 时间回溯到25年前,1998年春节前,刚出生三个月的解清帅在家中失踪。此后,解克锋踏上漫漫寻子路,为寻子花光家中积蓄后,解克锋重新振作起来一边创业一边寻子,曾承诺愿用百万重金酬谢送回儿子的人。 据了解,此番寻子成功源于人脸识别比对成功。认亲当天,解克锋表示,5天前他突然接到警方电话,经过人脸比对,儿子解清帅找到了。11月28日晚,DNA比对结果出来,“100%,一个数字都不差。” “亲人团聚的背后,是科技的力量在发挥作用,格灵深瞳自主研发的‘跨年龄同亲缘人脸比对算法’功不可没。”12月3日,格灵深瞳在其官方微博发布消息,称此次解克锋寻子成功背后的人脸比对算法出自该公司。 格灵深瞳官方微博 截图 格灵深瞳算法部负责人在视频中进一步解释,“大部分被拐儿童都是在小时候就与亲人失散,随着岁月流逝,其相貌早已发生了翻天覆地的变化,这给警方的排查带来很大的困难。基于遗传关系,亲属之间的人脸特征相似性会相对较高,利用这一规律,格灵深瞳的‘跨年龄同亲缘人脸比对算法’会筛选出相关性较高的疑似者,进行赋分排名,大幅度提升寻亲的整个效率。” 这次帮助解克锋寻找儿子,格灵深瞳用解克锋夫妻俩和大儿子的照片进行人像比对,结果在排位前五中就找到了解清帅。据悉,解清帅是近半年来,该公司协助警方找到的第4个孩子。 12月4日晚,格灵深瞳官方微博发表声明,称针对寻亲这个事情,格灵深瞳主要是配合警方提供技术和算法等工具,然后交由警方来应用。 尽管获得了成效,但跨年龄寻亲依旧是一件非常困难的事情。格灵深瞳方面称,该算法技术是一个持续优化的过程,“作为一家科技公司,我们的目标是协助警方找到更多的被拐卖人员,为了实现这个目标,我们还有许多工作要做。” 技术加持,缩小寻亲范围 “以前寻亲,只能一张张翻看、比对照片,人工排查匹配,由于时间跨度大、数据繁杂,工作量非常大。”一名负责寻亲的工作人员告诉记者,当人工智能在越来越多领域得到广泛运用,其在助力寻亲方面的优势不言而喻,能够节省大量的时间和人力,“利用人工智能,能够从成千上万份资料中找出匹配度最高的那份,极大地缩小了寻亲范围。” 跨年龄人脸识别技术。图源:《QQ全城助力》视频截图 如果多年前,科技的助力对于寻亲只是一个可选项的话,那么近几年,随着人工智能在各大领域的应用,人脸识别、图像识别等AI技术,越来越多地运用在了公安机关寻亲行动中。 记者查阅相关资料发现,有关AI寻亲的记录最早可追溯到8年前。在2015年微软的骇客马拉松上,利用人脸识别技术寻找儿童的应用程序就已被开发出来。该程序克服跨年龄相关技术挑战,后续微软与国内最大的公益寻人网站“宝贝回家”的合作,开发了一款名为“回家”的人工智能应用程序。 2016年初,“宝贝回家”成功找回一个走失4年的儿童,这是中国公益组织利用人脸识别技术寻找走失儿童的第一个成功案例。目前,“回家”应用程序已帮助超过1900位儿童找到了家。 在这之后,百度、腾讯等公司研发的“跨年龄人脸识别技术”,助力警方寻回不少失踪儿童。 2017年全国“两会”期间,全国政协委员,百度公司董事长兼CEO李彦宏的提案,就建议用AI和大数据技术帮助寻找丢失儿童。 该提案很快就有了一些突破,在不久后的《最强大脑》舞台上,百度人工智能机器人“小度”对一组幼童照片进行数据分析后,成功识别出到现场的20年后的成年人。在这个过程中,百度共展示了三个维度的AI技术,包含图像检索、人脸跨年龄识别和人脸跨代识别。 常人难以完成的任务,在AI面前却迎刃而解。除了在“舞台”上,同年,百度与民政部、“宝贝回家”等合作,推出“AI寻人”平台,用人脸识别技术帮助寻亲。截至2021年3月1日,百度“AI寻人”平台共计收到用户上传照片42万余张,寻亲成功数量达到12000多人次。 从2018年初开始,腾讯优图实验室经过近一年时间的资源投入和优化调整,进行了上千次模型训练,经历5次版本更新,最终沉淀版本为一个具有上千层复杂结构的深度神经网络模型,让跨年龄识别精度提升至近96%。据介绍,福建省公安厅“牵挂你”防走失平台使用该技术,仅2019年累计找回的走失儿童就有1091名。 除了跨年龄人脸识别技术之外,AI寻亲的优势还体现在照片修复上。不少寻亲的父母会将失踪孩子的照片放得很大,挂在旗帜上、印在车身处、贴在T恤上,而原先模糊的老照片,放大后更加难以辨认。 对此,2020年3月,当时还在攻读华中科技大学软件学院博士的盛建中,发起成立了一个“AI宝贝:让寻亲不再孤单”团队,很多同学知道后,也主动加入进来。 写代码、测试算法,盛建中和团队花了半年时间集中攻关,终于研发出一套图像修复人工智能算法,利用“全局修复”“人脸增强”“超分辨率重建”三大技术应用,准确修复了大量失踪儿童的模糊照片。 AI修复的模糊照片。图源:AI宝贝志愿服务队 截至2023年12月,团队已为1000余名失踪儿童修复照片,借助图像修复技术,11名失踪儿童被成功寻回。其中,在备受关注的电影《亲爱的》原型孙海洋寻亲一事中,团队帮助修复了儿子孙卓幼年的照片和孙海洋年轻时的照片,协助警方成功寻回孙卓。 “随着我们科技的进步,我相信我们的孩子,早晚都会回家的。”特意从江西赶到河北的杜小华说,他2014年认识解克锋,二人是寻亲路上的“战友”,同样他也是电影《亲爱的》原型中唯一仍在寻子的父亲。 “爱与责任”带来科技的温度  每一个寻亲者,背后都有一个曲折、幽暗的故事。AI技术的加持,像是照亮回家路的光,让那些丢失孩子的家庭得到一丝慰藉和依托,也让我们看到了冰冷科技背后的人文关怀。 从我国走失人口数据来看,中民社会救助研究院与“头条寻人"项目组在北京联合发布的《中国走失人口白皮书(2020)》数据显示,2020年我国走失人次达到了100万,但相较于2016年的394万人次以及2017年的260万人次已经显著减少。我国走失人群规模呈现逐年递减的状态,相比于五年前,该群体人数已经减少近75%。 2021年1月,公安部开展“团圆行动”,其中,人像比对技术发挥了重要作用,截至2022年6月1日,“团圆”行动已找回历年失踪被拐儿童11198名。冷冰冰的数字背后是一个个有温度的人生,每一次久别重逢的相拥、相泣和欢笑,离不开科技与爱的碰撞。 不可否认,AI技术加快了寻亲的步伐,在庞大的图像数据处理中,发挥着越来越重大的作用。但是,作为一种技术辅助手段,我们不应过分夸大其作用。 “在寻亲过程中,跨年龄同亲缘人脸比对算法等AI技术手段,只能作为一种辅助手段,它可以提高筛选效率,不能作为法律依据,最终结果还是要用可作为法律证据的DNA检测做判断。”研发设计出全国第一代“市民卡”、浙江大学智能教育研究中心特聘研究员张旭光向记者表示。 图源:微信公共图片库 除了人脸识别技术的不断创新,寻亲成功的背后,同样离不开家人和公安机关的不懈努力,以及社会各界的关心关注。 在帮助寻亲过程中,警方扮演着至关重要的角色。他们需要进行大量的前期准备工作,比如全面收集基础数据;与其他部门开展协作;运用各种新型科技手段,组织专人开展技术比对,并及时将比对结果下发至属地,进行落地核查等等。 而在认亲过程中,或多或少,双方都面临着煎熬的心理考验。警方需要花时间、花精力与双方沟通,做双方见面前信息的传递人。正是基于这份坚持,基于“爱与责任”,AI技术的可能才最终化为现实。 与此同时,无数社会组织和科技企业也在这场寻亲的战斗中投入火力,多一个平台,就多一份希望,但在“科技向善”背后,如何避免新技术的负面影响是对技术使用者的巨大考验。 AI技术是把双刃剑。在未来,我们期待看到AI技术的不断迭代,为更多寻亲家庭提供技术支持,照亮走失孩子的回家路。同时,“我们需要用法律和技术手段来约束AI技术带来的伦理和隐私等相关问题,以确保技术的发展能够真正造福人类。”张旭光说。