矿物地球化学大数据结合机器学习技术正在推动成岩成矿作用研究和找矿勘查。中国科学院地球化学研究所黄小文团队在胡瑞忠院士和周美夫研究员的指导下,成功搭建了具有自主知识产权的矿物地球化学数据信息系统(MinerGeochem),以闪锌矿大数据为例,取得了重要进展。首先,该系统整合了矿床、矿物、实验和文献等多维度数据,通过计算机信息技术、Web应用、关系数据库和GIS技术实现了全面的搜索与获取功能,目前已集成超过6万条标准化矿物微量元素数据,并支持可视化分析及智能化数据输入输出,获得了6项软件著作权,单日浏览量超过2万次。这为矿物大数据与机器学习的结合提供了高质量的数据支持,开辟了“矿床学-大数据-人工智能”交叉研究的新方向。其次,团队以全球4000余条闪锌矿微量元素为基础,评估了数据预处理与模型优化对机器学习算法性能的影响,提出了标准化数据处理框架,显著提升了模型精度。通过综合比较多种方法,研究发现KNN填补法和PCA、t-SNE等算法在特定条件下表现最佳,并利用递归特征消除和网格搜索与交叉验证显著提升模型精度,将5类矿床类型的分类准确率提升至95%。此外,研究建立了基于多种机器学习算法的可迁移矿床类型判别模型,针对MVT、VMS、SEDEX、Epithermal和Skarn五类矿床,评估了多种算法的分类效果,发现PCA、PLS-DA和KNN等算法表现最优。这些模型为隐伏矿体识别及覆盖区找矿提供了智能化解决方案,对矿产勘查具有重要实践意义。最后,通过主成分分析等多元统计方法,重新评估了“铟窗效应”,揭示了闪锌矿中铟富集机制具有显著的矿床类型专属性。研究表明,Cd和Fe含量对铟富集具有决定性影响,深化了对闪锌矿中铟富集机制的认识。综上所述,该团队的研究不仅为矿物大数据挖掘提供了标准化解决方案,还为地质大数据挖掘和矿产勘查提供了强有力的工具和方法。