使用 AI 提高燕麦的产量和抗病性
ARS 正面临谷物等主食作物面临的最大挑战。Craig Carlson 是北达科他州法戈市谷物作物改良研究小组的研究遗传学家。他的工作重点是燕麦定量遗传学,重点是开发具有卓越谷物质量和稳定抗病性的高产品种。
欢迎 Carlson 博士参加 Under the Microscope
UM:您研究燕麦的主要关注领域是什么?
CC:我的实验室专注于提高燕麦的遗传增益,这只是意味着随着时间的推移进行稳定和可衡量的改进。这些改进可以包括更高的谷物产量、更好的抗病性、营养和质量等。当育种者根据这些特征选择最好的植物并将其用作父母来创造下一代时,就会发生遗传增益。如果选择有效,种鸡种群的平均表现会从一代到下一代不断提高。这就像每个赛季都挑选最好的球员——如果你不断挑选表现最好的球员,那么你的战队(育种计划)很可能会年复一年地变得更好。
UM:农业研究历史上是如何解决燕麦遗传学的?
CC:野生燕麦和培育燕麦最具破坏性的疾病是冠锈病,它是由一种高度挥发的真菌病原体引起的。事实上,燕麦冠锈病的侵略性如此之强,以至于部署在新燕麦品种中的抗性基因通常在 5 年内被克服,这对科学家和种植者来说都是非常令人沮丧的。然而,利益相关者大力推动识别和部署其他形式的耐药性,这些抗性更稳定或不易被分解,从单基因“繁荣与萧条”的抗性转变为定量的多基因策略。
对冠锈病进行评级的传统方法称为 Cobb 方法,其历史可以追溯到 20 世纪初,美国农业部仍在使用。然而,这个量表只告诉我们寄主植物的疾病水平。这就是我们工作的意义所在:通过使用称为“计算机视觉”的 AI 分支量化疾病的实际体征和症状,帮助识别更持久的抗病来源,从而提供对植物-病原体相互作用的机制理解。
Craig Carlson 博士在现场
UM:关于燕麦,还有其他需要了解的重要问题吗?
CC:当然。燕麦在美国的种植面积仅为 ~150 万英亩,但全球市场价值约 90 亿美元。这种需求正在上升,因为燕麦天然不含麸质并且被证明对心脏有益,但与小麦和玉米等高价值商品作物相比,该作物的研究投资滞后。除了疾病之外,我们还解决了抗逆性(高温和干旱)、耐久性和最终用途质量问题,所有这些都会影响种植者是否会冒险种植更多的燕麦面积。有限的资源意味着育种者通常必须优先考虑抗锈性,但我们的多性状基因组工具使我们能够同时跟踪产量和质量性状,因此我们不会抢夺 Peter 来支付 Paul。
UM:没有 AI AI ,您能做些什么来做困难或不可能的事情?
CC:人工智能使我们能够快速准确地测量疾病的体征和症状。即使在可变的光照条件下,我们的深度学习模型也能识别脓疱(叶子上含有锈孢子的长方形橙黄色病变),这是人类无法大规模可靠地做到的。它还可以帮助我们将次要效应基因与复杂性状联系起来。通过将图像衍生的生长曲线与全基因组数据融合,我们可以更有效地确定下一轮杂交的最佳亲本。结合基因组学和表型组学,我们可以在种子落地之前预测性能。根据天气、土壤、多光谱数据和基因型训练的选择模型现在可以预测哪些实验品系在各种环境中站得住脚,从而可能节省多年的田间试验时间。这些工具共同挤压了育种周期,并帮助我们更快地发布改良品种。
UM:在你所做的工作中使用 AI 是否存在挑战?您如何应对这些挑战?
CC:最大的障碍是数据质量、泛化性和计算能力。我们通过构建精选图像集并与验证标签的病理学家合作来解决第一个问题。为了防止模型“过度拟合”一个用户或摄像机角度,我们在多位置、多年和多群体上进行训练,并运行盲验证。高性能计算可能很昂贵,因此我们依赖 USDA 的 SCINet 集群和 GPU 加速,这将为期一周的工作变成通宵运行。
UM:AI 目前是您工作的核心部分,还是您认为它仍处于实验或试验阶段?
CC:AI 专业知识是育种者工作台上的宝贵工具,但我不仅仅专注于 AI 研究。它牢牢地嵌入到我们的表型分析管道中——每个繁殖季节,我们都使用 AI 模型对疾病和生长进行评分,这些输出直接输入基因组选择模型。我们仍在试验的地方是闭合循环:允许算法自主前进或丢弃行。目前,人类(饲养员)仍然做出最终决定,但 AI 已经推动了候选名单。
UM:就其影响而言,您认为需要解决哪些关于 AI 的看法或误解很重要?
CC: “人工智能可以完成科学家的工作”。AI 不仅仅是大型语言模型 (LLM) 等产品。虽然似乎每周都有新的发展,但公众只是听到了适销对路的产品,而不一定是科学突破。作为一名科学家,我努力寻找最适合工作的工具,这通常意味着构建或修改现有设备和/或工具以满足要求。没有用户,AI 就没有用,没有目的就没有可衡量的好处。“人工智能会犯农民看不到的错误”。与任何实验室仪器一样,模型也经过校准、验证和版本控制;他们的误差线是已知的。“只有大公司才能负担得起 AI”。开源框架和公共 HPC 集群意味着 ARS 等公共育种者可以部署尖端模型并发布栽培品种以造福公众。
UM:总的来说,您认为人工智能的使用在未来几年将如何重塑燕麦和更广泛的植物育种科学?
CC:随着传感器技术的改进,我相信 AI 工具可以帮助监测和评估手动收集费力和/或昂贵的性状的田间试验。例如,如果我在北达科他州的多个环境中种植了一个种群,这意味着我的团队将不得不在整个生长季节多次出差并可能在酒店过夜。现在,为了提高效率,我们可以使用通过无人机或卫星收集的多光谱传感器数据,为重要的磁场特征开发良好的预测模型。数字表型将为我的团队腾出时间做其他重要工作,例如进行交叉分析、分析和解释这些数据,以及在同行评审期刊上发表我们的发现。
未来,我认为全季节预测模型有可能能够将天气预报与序列数据相结合,这将使种子公司和农民能够在种子生产和/或收购之前模拟“假设”情景。AI 的另一个好处是它可以清理嘈杂的数据,因此种植者很快就可以从自己的田地中提供图像,从而加快区域适应,这将有助于推进参与式育种实践。对于燕麦来说,更高效的数据收集意味着可以更快地实现稳定产量、冠锈病持久性和改善营养的长期目标。