本文提出利用随机森林进行掺假检测,将随机森林算法与从真实样本中人工生成异常值相结合。该方案应用于两项食品掺假研究:使用ATR-FTIR光谱法检测月见草油和使用NIR漫反射光谱法检测豆蔻粉。用大豆油、玉米油和向日葵油对月见草油油进行掺假,并用这些掺假油和其他不同的油(如玫瑰果油和安第罗巴油)以纯油和掺入的形式对模型进行了验证。肉豆蔻粉中掺入孜然、市售味精、土壤、烘焙咖啡皮和木屑。对于月见草油,提议方法的性能优于PLS-DA,且与SIMCA的性能相似;对于豆蔻粉,随机森林的性能优于PLS-DA和SIMCA。此外,在使用随机森林的两个应用中,没有从外部验证集中排除任何样本。