2020年10月29日,威斯康星大学麦迪逊分校(UW-Madison)发布了一场讲座的信息。讲座主题:建立适用于专业搜索任务的可解释信息检索模型,主讲人:王越,讲座时间:2020年11月17日下午15:00,会议地址:https://uwmadison.zoom.us/j/96378926598?pwd=NkNuRjJ3M2FyQlNmT0hzNjBpc2tMZz09
主讲人相关信息:王越是北卡罗来纳大学教堂山分校信息与图书馆科学学院的助理教授。他的研究兴趣包括文本数据挖掘,机器学习,信息检索,自然语言处理和健康信息学。他最近的工作集中于设计和评估交互式且可解释的机器学习算法,可以帮助科学家从大型非结构化文本中获取知识。这些算法已应用于广泛的数据挖掘任务,包括高检索率搜索、计算机辅助内容分析和临床自然语言处理。他在计算机和信息科学领域的著名场所出版,包括SIGIR,WSDM,ACL,KDD,AMIA和JAMIA。他是WSDM,SIGIR和WWW的常规计划委员会成员。
讲座的相关信息:在诸如精确医学文献搜索之类的专业搜索任务中,查询通常涉及多个方面。为了评估文档的相关性,搜索者将不遗余力地验证查询中的每个方面,并遵循特定任务的逻辑来做出相关性决策。在这种情况下,我们说搜索者会做出结构化的相关性判断,这与常规的单变量(二进制或分级)相关性判断相反。理想情况下,搜索引擎可以支持搜索者的工作流程并遵循相同的步骤来预测文档的相关性。这种方法不仅可以产生高效的检索模型,而且还为该模型提供了以与搜索者相同的“语言”来解释其决策的机会。在本次演讲中,王医生将讨论可解释的检索模型的最新工作,这些模型可模拟医学专家如何做出结构化的相关性判断。他使用TREC Precision Medicine文献搜索记录(2017-2019)中的数据发现,一个简单,可解释且标签有效的模型可以始终如一地执行复杂,黑匣子和需要数据的学习排名楷模。这些结果表明,利用专业搜索查询中的结构是朝着建立可解释的搜索系统以支持专业搜索任务的方向发展。