当前位置: 首页» 科研进展

机器学习模型直接预测农药等农业污染物在植物根系的累积

文章来源:农药应用风险控制创新团队      作者:李 远播   点击数: 次      发布时间:2022-01-05

近日,中国农业科学院植物保护研究所农药应用风险控制创新团队先后在环境领域TOP期刊Environmental Science & Technology和Journal of Hazardous Materials上分别发表题为“Direct Prediction of Bioaccumulation of Organic Contaminants in Plant Roots from Soils with Machine Learning Models Based on Molecular Structures”和“Predicting Crop Root Concentration Factors of Organic Contaminants With Machine Learning Models”的2篇研究论文,首次利用机器学习模型直接预测植物根部从土壤中吸收累积农药等有机污染物的量,解决了传统线性模型无法模拟农药被植物吸收的非线性关系,并揭示了影响植物累积农药的关键化学分子结构,为农产品在产地环境化学污染的预测提供了新的工具和手段。

农作物累积是农业污染物从土壤进入人类食物链的重要途径。准确预测植物吸收和累积农业污染物对保障食品安全、产地修复和人类健康暴露评估具有重要的意义。然而,由于污染物-土壤-植物根系之间复杂的相互作用,建立稳健可靠的预测模型仍然具有很大挑战性。传统的线性预测模型难以预测污染物-土壤-植物间的非线性关系,导致预测值与实际值差异较大。本研究对比了四种不同的机器学习算法,通过对341个数据点、72个化合物的数据集进行训练,预测植物根系富集值,证明了新构建的GBRT-ECFP的为最优预测模型,并通过5倍交叉验证评估了预测性能,其中R2值为0.77,平均绝对误差(MAE)为0.22。此外,本研究解析了化学分子、土壤与植物特性之间的非线性关系。子结构重要性分析明确了分子子结构与植物富集之间的关系,确定了-O、-Cl、芳环和大共轭π系统等为与植物累积相关的关键化学子结构。

本研究成功利用机器学习作为新兴手段预测农田作物对农药等污染物的吸收累积,展现了预测工具的先进性和通用性,为未来新农药植物吸收潜能评估和农田农药污染安全评价提供新的可靠工具。

美国耶鲁大学为论文的第一完成单位,中国农业科学院植物保护研究所为论文的共同通讯单位,农药应用风险控制创新团队李 远播研究员为2篇论文的共同通讯作者。该研究得到了国家重点研发计划、青年英才计划等项目的资助。

原文链接:https://pubs.acs.org/doi/abs/10.1021/acs.est.1c02376

https://www.sciencedirect.com/science/article/abs/pii/S0304389421024055

图1.机器学习模型预测植物吸收累积农业污染物的示意流程图



图2.比较4种不同机器学习模型预测性能及相关参数重要性解析