在信息检索评估中,池化是一种众所周知的技术,用于提取需评估的相关性文档样本。基于池化的文件,许多研究提出了不同的排序方法来判断文件所述的判断。这些方法遵循不同的策略,以减少评估工作。然而,对于创建可靠的测试集合需要多少相关性判断,并没有明确的指导。在本文中,我们调研并进一步开发确定何时停止进行相关性判断的方法。我们提出了一套高度多样化的停止方法,并对所得到的测试集合的有用性进行了全面的分析。本文介绍的一些停止方法将创新的召回估计与金融交易中使用的时间序列模型结合起来。