导语
未来,我们有望看到更多基于大数据和人工智能的智能农业解决方案涌现出来,为农业生产带来更加精准、高效、环保的变革。同时,这也将促进土壤学研究的深入发展,推动我们对土壤这一生命之基的理解达到新的高度。
作者:陈能场/广东省科学院生态环境与土壤研究所研究员、农业部土壤污染防治技术指导委员会委员 林大松/农业农村部环境保护科研监测所研究员
来源:《环球财经》(2025年合刊)
在科技日新月异的今天,人工智能(AI)已经渗透到我们生活的方方面面,从智能家居到自动驾驶汽车,无一不彰显着其强大的潜力和无限的可能性。然而,当我们把目光投向广袤的田野,一个古老而又充满生机的领域——土壤学,作为农业科学的基础学科之一,与人工智能的深度融合,正悄然改变着传统农业的面貌,引领我们步入智慧农业的新时代。
话说土壤学
土壤始于五亿多年前。直到只有在农业革命以后,人类才和土壤有着密不可分的关系,从那时起,人类不断地认识土壤、应用土壤和改良土壤,以期获得更高的收成和收入。但直到140年前,土壤学在俄国土壤学家道库恰耶夫(Vasily Dokuchaev)的发生性理论下才正式成为一门学科,至今只有近150年的历史。
土壤不仅复杂、高度变异性且多相,“树上没有两片相同的树叶,地上没有两片相同的土壤”,甚至有谚语“一只鸟两只脚下的土壤都是不相同的”,因此认识土壤内在的演变规律,认识外来物质对土壤的影响并不容易。
现代土壤学始于土壤调查,最初是一门用脚步走过、丈量的学问,现代土壤学的鼻祖道库查耶夫穿过乌克兰大草原数千公里才提出了土壤是母质、气候、生物、地形、时间共同作用下形成的一个历史自然体,美国从1899~1999花了上百年的时间进行土壤调查,从而提出了系统的土壤分类。土壤学的发展受限于土壤采样、分析、结果解释等需要大量的时间、劳力和财力,由于其复杂、高度变异,更受限于数学的应用。土壤调查、采样、分析不仅劳心费力,要将得到的结果进行解释并外推到未拓展的区域需要还需要极为谨慎。
数学的应用为土壤学的应用和发展开了一扇窗。犹记得在撰写大学毕业论文时,利用当时最简单的pc-1500利用磁带存储数据的小计算机将水土流域区数十个采样点,每个采样点10几个土壤物理、化学指标进行主成分分析,用简单的方式能表征出水土流失区的土壤肥力时,这让我对土壤学的数学应用惊叹不已。
从上世纪60年代开始土壤学借助水体、底泥沉积物产生的一些概念和模型加以数学上的分析,如水体的内梅罗指数、地累积指数等,让数学应用前进了一步,地统计学的应用让人们对土壤学的理解拓宽了视野,在调查土壤污染区域时,只要进行一定密度的土壤调查分析,利用ArcGIS就能轻松地将重金属污染污染的区域分布直观地表现出来,极大地深化对土壤污染过程和结果的深度理解。即便如此,这种点位采样与地质统计学相结合的做法具有破坏性、成本高且耗时。通常很难获得合适的数据量,地统计方法需要密集的基于点的采样数据来捕获空间异质性结构,而且无法准确地代表较大尺度上的变异性,由于需要大量的土壤样本,很难准确地描述它们的空间分布特征。
土壤的连续分布特征、土壤性质复杂且具有高度不均匀性特征、土壤圈的开发特征,以及土壤在人类社会的可持续发展中日益重要性,大量土壤数据的处理等等,长期以来,土壤学家们通过实地调查、实验室分析等手段,积累了丰富的土壤知识,为农业生产和生态保护提供了科学依据。然而,面对复杂多变的土壤环境和日益严峻的资源压力,传统的研究方法逐渐显露出其局限性。
AI为土壤学开启了全新大门
人工智能(AI)特别是机器学习(ML)技术的出现成功地化解了以上的难题。研究表明,在2019年2月1日完成的谷歌学术搜索中该搜索返回了七万多篇使用关键字“土壤”和“机器学习”的文章。手动审查所有关于机器学习在土壤科学中应用的论文是一项不可能完成的任务,为此,悉尼大学的道库查耶夫奖获得者麦克布雷特尼(Alex McBratney)教授的团队2020年全面回顾ML技术在土壤科学中的应用,并借助ML算法(潜在狄利克雷分配)在大量文本语料库中寻找模式,目的是深入了解ML在土壤科学中的应用出版物,并讨论该主题的研究差距,发现:(1)ML方法在土壤科学中的使用越来越多,主要集中在发达国家;(2)审查的出版物可分为12个主题,即遥感、土壤有机碳、水、污染、方法(集合)、侵蚀和母质、方法(NN、神经网络、支持向量机、支持向量机)、光谱学、建模(类)、作物、物理和建模(连续);(3)高级机器学习方法通常比简单的方法表现更好,因为它们能够捕获非线性关系。从这些发现中,找到了研究差距,特别是关于应采取的预防措施(简约)以避免过度拟合,以及ML模型的可解释性是应用先进的ML方法时要考虑的一个重要方面,以提高我们对土壤的了解和理解。我们预计,大量的研究将集中在后一个主题上。
如,镉(Cd)是一种有毒金属,在农业土壤中无处不在。与其他有毒金属相比,镉更容易被农作物吸收,积聚在可食用部分,在日本发生的痛痛病就是因为镉污染陆地食物链造成的。在中国,一项全国性的调查显示,大约7%的农业土壤样品的Cd浓度超过了土壤Cd的环境质量标准,在所有污染物中排名最高。为了管理受污染的土壤以生产安全食品,利用土壤特性预测粮食作物可食用部分的Cd浓度,对于前端的土壤管理和后端的人体健康都具有极为重要的意义。
至今,已经有令人满意的多元线性回归模型来预测小麦等旱地作物的镉含量,其中土壤总镉浓度和pH值是重要的影响因素。相比之下,对于水稻,多元线性回归模型在大区域尺度上预测水稻籽粒Cd积累的效果要差得多,并且水稻籽粒Cd与土壤Cd浓度之间的相关性通常较差。较差的相关性表明,土壤Cd浓度不是预测水稻籽粒Cd积累的良好指标。此外,土壤pH值、有机质(OM)和其他土壤特性的夹杂物并不能提高拟合性能。机器学习提供了算法,可以挖掘隐藏的模式或从杂乱、不规则和高维数据中推断相关性,并结合了分类和回归的主要功能。
Huang等(2024)的研究表明,基于机器学习的方法可用于预测区域尺度的水稻籽粒Cd浓度,其性能比最好的多元线性回归方法要好得多。影响籽粒Cd积累的最重要变量是无定形Fe-Mn氧化物结合的Cd,其次是土壤pH值、籽粒灌浆后期土壤含水量和土壤可还原Mn浓度。使用基于机器学习的方法进行情景分析表明,将研究区的土壤石灰化至6.5的目标pH值,结合低Cd积累的水稻品种,可以实现中国土壤行动计划设定的95%安全利用该地区受Cd污染土壤的目标。该策略在华南地区Cd污染区实施相对容易且具有成本效益。
此外,在土壤污染领域,模拟各种环境条件和土壤污染之间的复杂非线性关系的机器学习模型最近已经成为预测土壤污染空间分布和识别污染来源的有力工具。如深度神经网络(DNN)模型成功用于模拟整个欧洲大陆的土壤汞含量。随机森林需要的数据较少,并且可以发展非线性关系。随机森林已被用于根据土壤特性预测作物中的重金属含量,优于其他机器学习方法,RF方法具有提高基于土壤性质和养分元素的水稻Cd含量预测性能的潜力。
机器学习除了在土壤污染领域能够有很好的应用之外,在以下的领域也得到很好的应用。
一、在土壤调查和土壤制图方面
ML等人工智能是必不可少的助手。ML算法在数字土壤制图(DSM)中的应用正在改变土壤科学家制作地图的方式。在过去的20年中,土壤科学家通过使用各种ML算法在从局部到全球的空间尺度上绘制土壤属性或类别,将ML应用于广泛的场景。由于数据可用性的增加、环境空间数据的访问便利性以及由计算工具辅助的软件解决方案的开发,使机器学习在土壤制图中的广泛采用成为可能。
二、在精准农业方面
利用土壤采样分析取得土壤肥力状况来指导施肥是土壤农业化学的通常做法,但这是是劳动密集型和耗时的工作,往往导致决策延迟,通过利用机器学习,能提供快速而精确的解决方案,让农民对土地的肥料状况能做到实时把握。机器学习模型的使用可以简化和帮助理解土壤质量参数,并指出那些最能表达遭受环境影响的地区与处于生态平衡状态的地区之间的差异的参数,以及预测研究区域的土壤健康。
三、智能灌溉
物联网技术能帮助实现智能灌溉。通过监测土壤的湿度变化,系统能够自动判断作物是否需要灌溉,并控制灌溉设备的开关,实现按需灌溉。这种智能化管理方式,既能满足作物生长的水分需求,又能有效节约水资源。
四、病虫害预警
土壤中的微生物群落变化往往与作物病虫害的发生密切相关。物联网技术可以监测土壤微生物的多样性和活性,结合大数据分析,提前预警潜在的病虫害风险,为农业生产者提供及时的防控措施。
五、获得更好的土壤数据
土壤科学家和工程师通常需要体积密度(Db)数据作为预测各种土壤过程的模拟模型的参数输入。现有的测量Db的现场方法,但是劳动密集且耗时,利用大数据基于土壤性质的多元回归模型可以为预测Db提供相对准确的替代方法。土壤质地和粒径分布是理解和解释土壤农业系统中多种过程和相互作用的重要土壤特性。然而,由于成本原因,土壤粒度分析很少包含在常规土壤实验室分析中,但可以从其他土壤物理化学特性和使用机器学习技术从更强大的回归中得出来。
总之,当土壤学遇上人工智能,两者之间的碰撞激发出无限可能。一方面,土壤学为深度机器学习提供了丰富的数据源和明确的应用场景。土壤的物理性质、化学组成、生物活性以及空间分布等信息,都是深度机器学习模型可以学习和利用的重要特征。另一方面,深度机器学习则为土壤学研究提供了更为高效、精准的工具。通过对土壤数据的深度挖掘和分析,可以揭示土壤性质与生态环境、农业生产之间的复杂关系,为精准施肥、病虫害预警、土壤污染监测等提供科学依据。
ML应用或因忽视土壤科学知识带来失误
有人担心ML应用忽略了土壤科学知识,结果可能具有误导性和错误性。的确如此,不适合的模型参数和模型选择往往会带来错误的结果。有人开发ML模型,研究土壤特性、气候特征和有效镉之间的复杂交互作用,旨在确定关键影响因素,通过分层抽样、贝叶斯优化和10倍交叉验证相结合的方式获得最优模型。结果表明,土壤pH值、地表压力、显热净通量和有机质含量对土壤中Cd积累量有显著影响。有人研究利用中国土壤调查史和气候变化数据,预测了中国地区有效镉的空间分布趋势,突出了镉活性较高的主要区域。这些地区主要分布在中国东部、南部、中部和东北部。这个结论显然与现实理解和事实是不相符合的(Yang et al.2024)。有人认为,如果机器学习“忽视土壤科学知识”,很可能产生误导性/错误结果,但只有在世界范围内进行全面测试时才能被接受或揭穿(Babatunde Anifowose and Fatai Anifowose.2024)。因此,在如何在土壤科学研究中恰当地选择ML模型,非常重要。
虽然不像其他科学那样经典,但土壤科学是一个综合的知识和研究领域,在火热的人工智能应用于土壤科学和环境科学的研究中,存在着不恰当地使用人工智能工具的风险。应该将土壤知识融入机器学习中。建议将机器学习和领域知识相结合,以开发更有意义的模型来预测土壤科学领域的土壤特性。
结语
随着技术的不断进步和应用场景的持续拓展,土壤学与人工智能的融合将更加深入。未来,我们有望看到更多基于大数据和人工智能的智能农业解决方案涌现出来,为农业生产带来更加精准、高效、环保的变革。同时,这也将促进土壤学研究的深入发展,推动我们对土壤这一生命之基的理解达到新的高度。
总之,土壤学与人工智能的交融是科技进步与农业发展的必然产物。它不仅为我们提供了解决当前农业挑战的新思路和新方法,更为我们描绘了一幅未来农业的美好蓝图。
原文链接:https://mp.weixin.qq.com/s/6EkIpHYfBHUh7yjYeWzgPg