《何时停止相关性判断?关于停止构建信息检索测试集方法的研究》

  • 来源专题:图书情报
  • 编译者: xuxue
  • 发布时间:2018-11-22
  • 在信息检索评估中,池化是一种众所周知的技术,用于提取需评估的相关性文档样本。基于池化的文件,许多研究提出了不同的排序方法来判断文件所述的判断。这些方法遵循不同的策略,以减少评估工作。然而,对于创建可靠的测试集合需要多少相关性判断,并没有明确的指导。在本文中,我们调研并进一步开发确定何时停止进行相关性判断的方法。我们提出了一套高度多样化的停止方法,并对所得到的测试集合的有用性进行了全面的分析。本文介绍的一些停止方法将创新的召回估计与金融交易中使用的时间序列模型结合起来。

相关报告
  • 《DNA检测能够判断抗体的有效性》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:huangcui
    • 发布时间:2019-01-18
    • 使用基于DNA的精确纳米结构设计 - 瑞典卡罗林斯卡医学院的科学家能够证明密集的抗原之间最准确的距离,以便获得免疫系统中结合能力最强的抗体。该研究发表在《Nature Nanotechnology》杂志上,这一研究对抗癌疫苗和免疫疗法的发展具有重要意义。 抗体或免疫球蛋白可能是身体抵抗感染的最重要部分,可以非常有效地结合抗原。抗体具有Y形结构,其中每个“臂”可以结合抗原。以这种方式,每个抗体分子通常可以结合两个抗原分子。 在目前的研究中,研究人员检查了抗原的密切程度和相隔多远,而不会显着影响抗体同时结合两种分子的能力。 “我们第一次能够精确测量抗原之间的距离,从而最大程度地同时结合不同抗体的两个臂。大约16纳米的距离提供最强的结合,”该研究还表明,免疫球蛋白M(IgM)是第一种参与感染的抗体,它具有明显更大的范围,即结合两种抗原的能力,比以前认为的要好。 IgM还具有比感染后期产生的IgG抗体显着更大的范围。 “我们研究抗体的结构和功能之间的关系。当我们设计下一代疫苗和抗体来定制治疗严重疾病时,这种洞察力非常重要。我们一直在寻找可以帮助我们获得详细信息的新方法了解不同抗体如何与抗原结合”。
  • 《客座演讲:针对专业搜索任务的可解释信息检索模型》

    • 来源专题:图书情报
    • 编译者:luoluo
    • 发布时间:2020-11-02
    • 2020年10月29日,威斯康星大学麦迪逊分校(UW-Madison)发布了一场讲座的信息。讲座主题:建立适用于专业搜索任务的可解释信息检索模型,主讲人:王越,讲座时间:2020年11月17日下午15:00,会议地址:https://uwmadison.zoom.us/j/96378926598?pwd=NkNuRjJ3M2FyQlNmT0hzNjBpc2tMZz09 主讲人相关信息:王越是北卡罗来纳大学教堂山分校信息与图书馆科学学院的助理教授。他的研究兴趣包括文本数据挖掘,机器学习,信息检索,自然语言处理和健康信息学。他最近的工作集中于设计和评估交互式且可解释的机器学习算法,可以帮助科学家从大型非结构化文本中获取知识。这些算法已应用于广泛的数据挖掘任务,包括高检索率搜索、计算机辅助内容分析和临床自然语言处理。他在计算机和信息科学领域的著名场所出版,包括SIGIR,WSDM,ACL,KDD,AMIA和JAMIA。他是WSDM,SIGIR和WWW的常规计划委员会成员。 讲座的相关信息:在诸如精确医学文献搜索之类的专业搜索任务中,查询通常涉及多个方面。为了评估文档的相关性,搜索者将不遗余力地验证查询中的每个方面,并遵循特定任务的逻辑来做出相关性决策。在这种情况下,我们说搜索者会做出结构化的相关性判断,这与常规的单变量(二进制或分级)相关性判断相反。理想情况下,搜索引擎可以支持搜索者的工作流程并遵循相同的步骤来预测文档的相关性。这种方法不仅可以产生高效的检索模型,而且还为该模型提供了以与搜索者相同的“语言”来解释其决策的机会。在本次演讲中,王医生将讨论可解释的检索模型的最新工作,这些模型可模拟医学专家如何做出结构化的相关性判断。他使用TREC Precision Medicine文献搜索记录(2017-2019)中的数据发现,一个简单,可解释且标签有效的模型可以始终如一地执行复杂,黑匣子和需要数据的学习排名楷模。这些结果表明,利用专业搜索查询中的结构是朝着建立可解释的搜索系统以支持专业搜索任务的方向发展。