《基于遗传算法优化机器学习分类的番茄叶部真菌病害图像数据集与智能诊断框架》

  • 编译者: 季雪婧
  • 在智慧农业快速发展的今天,作物病害的早期诊断对保障粮食安全至关重要。番茄作为全球广泛种植的经济作物,极易受到多种真菌病害的侵袭,其中Alternaria alternata(链格孢菌)、Alternaria solani(茄链格孢菌)、Botrytis cinerea(灰葡萄孢菌)和Fusarium oxysporum(尖镰孢菌)是四种危害严重的病原体。这些病害在叶片上常表现为褐斑、萎蔫等相似症状,即使经验丰富的农艺师也难以肉眼准确区分。传统实验室检测方法如酶联免疫吸附测定(ELISA)、聚合酶链式反应(PCR)虽然准确,但成本高、耗时长,难以在田间大规模应用。尽管机器学习(ML)和深度学习(DL)技术在植物病害识别中展现出潜力,但其性能高度依赖于高质量数据集和精细的模型调优。现有公共数据集多在受控环境下采集,缺乏真实世界的复杂性;而模型训练中的特征筛选和超参数优化往往依赖经验,制约了分类精度的进一步提升。针对这些瓶颈,由新疆农业科学院农业机械化研究所Guifu Ma、Chenming Zuo、Xiaohang Liu、Seyed Mohamad Javidan等学者组成的研究团队,在《Smart Agricultural Technology》上发表了一项创新研究。他们不仅构建了一个在自然光下用智能手机拍摄的、包含3000张标注图像的番茄叶部真菌病害RGB数据集,还设计了一套基于遗传算法(GA)的元启发式优化框架,显著提升了机器学习模型的分类性能。下载MMPs海报药物开发的最新进展。MMPs成为癌症、心血管疾病和炎症性疾病的重要靶点。领 取本研究采用了几项关键技术方法。首先,研究人员在温室条件下人工接种番茄植株,系统采集了四种真菌病害及健康叶片的图像,构建了均衡分布的图像数据集。其次,通过图像预处理流程(包括绿色通道提取、边缘检测、形态学膨胀和孔洞填充)精确分离叶片与背景。接着,从RGB、HSV、lab*和YCbCr等多种颜色空间中提取颜色特征(如均值、最大值、标准差、中位数),利用灰度共生矩阵(GLCM)计算纹理特征(如熵、能量、对比度、同质性),并量化形状特征(如周长、面积、圆形度指数)。最后,研究核心是应用遗传算法进行双目标优化:一是从68个初始特征中筛选出最具判别力的特征子集,二是同步优化支持向量机(SVM)和随机森林(RF)的关键超参数(如SVM的核函数与代价函数,RF的最小叶节点规模与父节点规模)。模型性能通过5折交叉验证和准确率(Accuracy)、精确度(Precision)、灵敏度(Sensitivity)、特异性(Specificity)和F值(F-Measure)等指标进行全面评估。3.1. 特征选择由遗传算法实现遗传算法从颜色、纹理和形状三大类特征中分别筛选出6个关键特征。分析表明,纹理特征(如熵、能量、偏度)对分类的贡献最大,其单独分类准确率达70.13%;颜色特征(如RGB B波段最大值、YCbCr Y波段中位数)次之,准确率为65.45%;形状特征(如周长、面积)相对影响较小,准确率为53.02%。这证实了病害导致的叶片表面不规则性在区分相似症状时具有最高判别价值。广告Western blot成像:电子压片无需暗房,简单快速高效准确,强弱条带同时成像不过曝——e-BLOT3.2. 遗传算法优化前的分类在优化前,SVM模型的总体分类准确率为68.17%,RF模型为80.83%。SVM对Fusarium oxysporum(尖镰孢菌)的识别尤其困难,灵敏度低至47.54%,表明其线性分类本质难以处理病害特征间的复杂非线性关系。而RF凭借其集成学习的优势,对A. alternata(链格孢菌)的识别灵敏度达到95.54%,显示出更强的鲁棒性。3.3. 遗传算法优化后的分类经过遗传算法优化后,两种模型的性能均实现飞跃。SVM的准确率提升至87.17%,但对F. oxysporum的识别仍是其弱项。RF模型表现尤为突出,总体准确率达到98%,对所有病害类别和健康叶片的精确度、灵敏度、特异性均超过95%,F值也维持在97.12%至98.76%的高水平。优化过程还对比了决策树(DT)和k近邻(k-NN)模型,GA使DT准确率从62.12%提升至74.08%,k-NN从68.47%提升至78.36%,进一步验证了元启发式优化策略的普适有效性。与近期其他研究对比(如基于YOLOv8n、Vision Transformer等深度学习方法),本研究提出的GA优化RF框架在准确率上具有竞争力,同时保持了模型的可解释性和较低的计算资源需求。该研究的结论部分强调,通过将专门构建的真实世界图像数据集与智能优化算法相结合,能够极大提升番茄叶部真菌病害的诊断效率和准确性。遗传算法在特征选择和超参数调优中的双重作用,是突破传统机器学习性能瓶颈的关键。研究不仅证实了纹理特征是区分视觉重叠症状的最重要指标,也展示了随机森林模型在经过优化后处理复杂农业图像数据的卓越能力。讨论部分指出,这项研究的成功为开发轻量、高效、可解释的田间实时病害诊断系统提供了坚实的技术路径。相较于需要海量数据和强大算力的深度学习方法,本框架更适合在资源受限的边缘设备(如智能手机、嵌入式传感器)上部署,有助于推动人工智能在精准农业中的普惠应用。未来工作可扩展至更多作物病害类型,并集成环境传感器数据,以构建更加全面、自适应的植物健康智能监测生态系统。本研究针对番茄叶部真菌病害视觉症状重叠、传统检测方法效率低下的问题,开发了一个包含3000张RGB图像的新数据集,并提出了一个结合遗传算法(GA)的元启发式机器学习框架。通过GA同步优化特征选择和支持向量机(SVM)、随机森林(RF)等模型的超参数,使SVM和RF的分类准确率分别提升至87.17%和98%。


相关报告
  • 《遗传学家通过 CRISPR 更正番茄育种冲突》

    • 来源专题:转基因生物新品种培育
    • 编译者:Zhao
    • 发布时间:2017-05-26
    • 在上世纪50年代,科学家在加拉帕戈斯群岛发现一种野生番茄,没有类似关节一样的膨大的茎部。关节是茎秆的薄弱部分,使果实很容易从植物上脱落。育种家们发明了无接缝的西红柿,以延长植物果实在茎秆上的停留时间。然而,当与现有番茄品种杂交时,产生的植物有花枝,产生了许多额外的枝干,看起来像扫帚,终点部分有大量的花。这导致了番茄果实数量的减少。 许多年后,纽约冷泉港实验室的遗传学家Zachary Lippman和其他研究人员追踪与无缝特质有关的基因与另一个基因,该基因是促进绿色大帽叶顶上的果实结构形成的基因。然后他们用CRISPR-Cas9修正特性冲突,导致了不同的植物结构的番茄植株,包括那些长的,花枝细长的浓密的,像菜花一样的植株,和一些能使番茄果实收成更好的植株。
  • 《人工智能和机器学习可以成功诊断多囊卵巢综合征》

    • 来源专题:新一代信息技术
    • 编译者:袁晨
    • 发布时间:2023-11-29
    • 美国国立卫生研究院的研究回顾了25年的数据,发现人工智能/机器学习可以检测到常见的激素紊乱。 根据美国国立卫生研究院的一项新研究,人工智能(AI)和机器学习(ML)可以有效地检测和诊断多囊卵巢综合征(PCOS),这是女性中最常见的激素失调,通常在15至45岁之间。研究人员系统地回顾了已发表的使用AI/ML分析数据来诊断和分类PCOS的科学研究,发现基于AI/ML的程序能够成功检测PCOS。 美国国家环境健康科学研究所(NIEHS)的高级研究员和内分泌学家Janet Hall医学博士说:“鉴于社区中PCOS诊断不足和误诊的巨大负担及其潜在的严重后果,我们希望确定AI/ML在识别可能有PCOS风险的患者中的应用。”NIEHS是美国国立卫生研究院的一部分,也是该研究的合著者。“人工智能和机器学习在检测多囊卵巢综合征方面的效果比我们想象的还要令人印象深刻。” 多囊卵巢综合征发生时,卵巢不能正常工作,并在许多情况下,伴随着睾丸激素水平升高。这种疾病会导致月经不规律、痤疮、面部毛发过多或脱发。患有多囊卵巢综合征的女性患2型糖尿病、睡眠、心理、心血管和其他生殖疾病(如子宫癌和不孕症)的风险通常会增加。 该研究的资深作者、NIEHS的助理研究医师和内分泌学家Skand Shekhar博士说:“鉴于多囊卵巢综合征与其他疾病的重叠,诊断多囊卵巢综合征可能具有挑战性。”“这些数据反映了将AI/ML纳入电子健康记录和其他临床环境以改善多囊卵巢综合征女性的诊断和护理的未开发潜力。” 研究作者建议将基于人群的大型研究与电子健康数据集结合起来,并分析常见的实验室测试,以确定能够促进多囊卵巢综合征诊断的敏感诊断生物标志物。 诊断基于多年来发展的广泛接受的标准化标准,但通常包括临床特征(如痤疮,毛发生长过多和月经不规律),伴有实验室(如高血睾酮)和放射学表现(如卵巢超声显示多个小囊肿和卵巢体积增大)。然而,由于多囊卵巢综合征的一些特征可能与其他疾病如肥胖、糖尿病和心脏代谢疾病共同发生,因此它经常被忽视。 人工智能指的是使用基于计算机的系统或工具来模仿人类的智能,并帮助做出决策或预测。ML是AI的一个分支,专注于从以前的事件中学习,并将这些知识应用于未来的决策。人工智能可以处理大量不同的数据,例如来自电子健康记录的数据,使其成为诊断多囊卵巢综合征等难以诊断的疾病的理想辅助工具。 研究人员对过去25年(1997-2022年)发表的关于该主题的所有同行评审研究进行了系统回顾,这些研究使用AI/ML检测多囊卵巢综合征。在一位经验丰富的NIH图书管理员的帮助下,研究人员确定了可能符合条件的研究。他们总共筛选了135项研究,其中31项被纳入了论文。所有研究都是观察性的,并评估了AI/ML技术在患者诊断中的应用。大约一半的研究包括超声图像。研究参与者的平均年龄为29岁。 在采用标准化诊断标准诊断PCOS的10项研究中,检测准确率在80-90%之间。 Shekhar说:“在一系列诊断和分类模式中,人工智能/机器学习在检测多囊卵巢综合征方面表现非常出色,这是我们研究中最重要的收获。” 作者指出,基于人工智能/机器学习的项目有可能显著提高我们早期识别多囊卵巢综合征女性的能力,节省相关成本,减轻多囊卵巢综合征患者和卫生系统的负担。 具有强大验证和测试实践的后续研究将允许人工智能/机器学习在慢性健康状况中的顺利整合。