《古汉语命名实体识别国际评测顺利举办》

  • 编译者: 程冰
  • 发布时间:2025-07-23
  •   中国社会科学网报道,5月4日,古汉语命名实体识别国际评测(EvaHan2025)研讨会线上线下同步举行。

      古汉语命名实体识别国际评测是专注于古代汉语的命名实体识别任务展开的技术评测比赛,目的是基于当前学界已有的古代汉语命名实体识别研究成果,探索大语言模型对古汉语的处理应用,与海内外高校、研究单位合作,共同推进古代汉语自动分析技术的研究。

      会议邀请著名计算语言学家、新疆大学中国语言文学学院教授冯志伟做了题为“古汉语文本命名实体识别”的特邀报告。报告回顾了古汉语信息处理的概貌,指出古汉语文本在繁简字、标点与命名实体方面存在的特殊困难,以及当下的大语言模型对古文处理还较为薄弱的现状,提出古文命名实体识别是一项非常关键而迫切的研究任务。

      李斌作了古汉语命名实体识别国际评测(EvaHan2025)总体情况报告,介绍了四家单位建设标注数据的艰辛历程,总结了十多个参赛队的技术特点和评测的三点主要结论:史传类古籍的六类命名实体中,人名、地名、时间、职官的识别效果好,而书名和国名还有待提升;中医古籍中的六类命名实体中,饮片、方剂、穴位的识别率较高,而证候、疾病和症状的识别率还较低;大语言模型对原文的随机修改是需要特别注意的问题。

      研讨会期间,10支参赛队分别作了技术报告,展开交流与讨论。经过综合评比,蜜度科技股份有限公司—中国人民大学团队获得一等奖,南京大学团队和武汉大学—北京大学团队获得二等奖,多伦多大学—曼彻斯特大学团队和东北林业大学两个团队获得三等奖。冯志伟表示,本届评测有效地提升了古汉语特别是中医古籍中的命名实体效果,对挖掘古籍中的文化珍宝十分有益。李斌对各参赛队表示感谢并提出,未来还将举办更多古汉语的国际评测,推动古籍的保护和传承创新。

      中国古代典籍浩如烟海,蕴含着深厚的史学与文学价值,是世界文明的瑰宝。为了更好地开发和利用古籍资源,传承并弘扬中华优秀传统文化,对古籍进行数字化深加工处理显得尤为重要。在古籍数字化加工的过程中,人名、地名、职官等命名实体标注是关键的一环,尤其是有着重要医疗价值的中医药方、证候等实体。如果根据传统方法,仅依靠专家学者手工完成命名实体标注,不仅耗费大量人力物力,还难以满足规模化处理的需求。因此,面向古汉语的命名实体识别工作,在推动古籍的创造性转化与创新性发展,以及促进中华文化的传承与传播方面,具有重要意义。目前,古汉语命名实体识别的研究尚未成熟,缺乏统一的评估体系和规范化的评测方法,推动标准化的古汉语命名实体识别评测显得尤为迫切和必要。专门针对古汉语的系列国际评测(EvaHan)将在2025年的评测中重点聚焦这一领域,力求建立高质量的数据集和统一的评测机制,推动古汉语命名实体识别研究的系统化和规范化发展。

      据介绍,该评测由中国人工智能学会主办,南京师范大学文学院、南京师范大学语言大数据与计算人文研究中心、南京农业大学信息管理学院、南京理工大学经济管理学院、中国中医科学院中医药信息研究所联合组织。在5个月的时间里,2024年12月发布训练数据,2025年2月15日—22日正式开赛,2月底提交技术报告,3月中旬完成论文修改,5月4日举行评测研讨,线下会议地点在美国新墨西哥州阿尔伯克基市,是北美计算语言学大会NAACL2025子会议第二届古代语言处理研讨会(ALP2025)的重要组成部分。共有来自加拿大、法国等海内外高校的23支队伍报名参加评测,最终有13支队伍完赛。

相关报告
  • 《国际图联取消举办2020年世界图书馆和信息大会》

    • 来源专题:图书情报
    • 编译者:xuxue
    • 发布时间:2020-04-30
    • 国际图联管理委员会和爱尔兰国家委员会经过艰难的权衡,决定取消2020年世界图书馆和信息大会。由于原计划举办2022年大会的新西兰国际会议中心无法如期竣工,都柏林将接过这一届的主办权。 1、艰难但必要的决定 世界图书馆和信息大会(World Library and Information Congress,简称WLIC)是图书馆界规模最大的国际会议,为各馆提供了相互学习、拓展关系、增进友谊的重要契机,因此取消2020年大会是一个艰难的决定。我们知道,该大会为图书馆界带来了丰富的灵感和动力。这将是1946年以来第一次取消举办该大会。 然而,当前所有大型国际活动都面临着艰巨的挑战。国际图联坚信会员、志愿者、东道主、参展商、赞助商和员工的健康高于一切;此外,各国出行限制日益严格,新冠病毒在多个国家也存在不同程度的蔓延。 我们预计并期待最坏的情况将在今年8月之前结束,但仍然存在太多不确定性,因此我们无法保证能举办一场安全、开放和振奋人心的活动,尽管会议主办方——爱尔兰国家委员会完成了极为出色的工作。国际图联管理委员会和爱尔兰国家委员会一致同意,鉴于目前的形势,今年的大会无法如期举行。 虽有遗憾,但我们希望做出明确的决定,以使全球图书馆界作好下一步安排。世界各地的信息与情报工作者(其中很多人的工作和生活受到了极大的限制)仍需竭尽全力,为当地社群提供最好的服务。 我们承诺向参会者、赞助商和参展商退还收取的全部费用。 由于无法照常在大会期间举办会员全体会议(理事会会议),我们将另行安排时间和地点,最晚在2020年11月30号前举行。 2、未来的世界图书馆和信息大会 今年无法举办世界图书馆和信息大会,因此未来的大会对于持续推进国际图联和全球图书馆界转型的意义更加重大。 我们很高兴地宣布,荷兰鹿特丹正在顺利筹备2021年的大会。我们将与荷兰国家委员会定期沟通,尽力为各方提供一个学习、合作与探索荷兰图书馆界的良好机遇。 关于2022年的大会,我们很遗憾地接到通知,原计划承办会议的奥克兰会议中心建设再次延期。目前的疫情导致供应链中断,给施工造成了更大困难。因此,该场馆无法确保在大会前如期完工。新西兰没有其他类似可用场馆。 国际图联管理委员会与新西兰国家委员会协商决定中止奥克兰为2022年大会的筹备工作。我们对此深感遗憾,这对于全球图书馆和情报工作者以及新西兰国家委员会都是一个损失。新西兰在太平洋地区宣传国际图联做出了卓越的贡献,彰显了本国图书馆界的工作热情和专业能力。 鉴于此,国际图联决定在都柏林举办2022年世界图书馆和信息大会。我们对爱尔兰国家委员会目前完成的出色工作,及其对取消今年大会的配合深表感谢,期待未来在爱尔兰举办大会。另外,我们鼓励欧洲以外的国家和地区积极申办2023年大会。
  • 《《通用大模型评测体系2.0》发布》

    • 编译者:程冰
    • 发布时间:2025-10-20
    • 6月24日,认知智能全国重点实验室牵头,联合中国科学院文献情报中心、中国科学院人工智能产学研创新联盟、长三角人工智能产业链联盟发布了《通用大模型评测体系2.0》(以下简称“评测体系2.0”)。 这是该评测体系自2023年6月发布以来的首次重大升级。“评测体系2.0”以技术迭代与产业需求为导向,在评测维度扩展、专项能力深化、评测方法优化等方面实现全面突破,为中国大模型产业发展提供更加科学的标准化支撑。 评测任务扩展至1186项全模态覆盖引领行业前沿,相比1.0版本的7大能力维度、71类任务类型、481个细分任务,“评测体系2.0”实现了全方位升级。 在任务规模上,“评测体系2.0”涵盖8大类、1186项细分任务,任务规模扩大至近2.5倍;在模态能力方面,从原有的文本/图片单一模态扩展至文本、图片、语音、视频全模态覆盖,新增了多模理解、多模生成、语音交互等能力评测;在语言支持上,从中文为主扩展至中英文并重,支持多语言评测,基础通用认知能力全面支持中英文双语评测。