关键词:
树木死亡建模
森林动态
数据挖掘
机器学习
摘要:
树木死亡是森林生态系统动态的重要过程之一。由于森林生态系统物种丰富,环境复杂,对个体树木的死亡预测以及死亡机制的了解一直以来都是森林生态学研究的重点和难点。传统参数统计模型由于自身限制,例如对数据分布的要求和多重共线性等原因,在实际应用中往往受到一定限制,无法较好应用在复杂森林生态系统动态的分析建模研究中。与此同时,随着近年来大批大型森林动态监测样地的建立,以及调查内容与手段的丰富,使得森林监测数据的数量规模和复杂程度都达到了前所未有的新高度,同时也为分析建模研究带来了挑战。由于这些森林生态学大数据的数据规模巨大,数据连续性高,数据结构层次复杂,传统的统计分析和建模方法在应对这类大数据时往往效果不佳,而针对这类大数据,新的机器学习方法在分析建模效率和模型表现上往往发挥出色,此外机器学习方法对数据格式要求较低,没有多重共线性等传统统计模型的限制,能够有效处理大量复杂数据,近年来已成为不同学科研究必不可少的工具。本研究采用非参数机器学习方法,对巴拿马巴罗克罗拉多岛50公顷森林大样地BCI连续35年的树木普查数据进行挖掘,建立个体树木死亡预测模型。结合文献中广泛收集到的生物因子和非生物因子数据,通过特征工程手段,构建了包含树木特征,功能性状,种内种间相互作用,土壤化学特性,地形特征,以及气候特征在内的106个预测因子作为自变量,将树木存活状态作为因变量,分别用传统参数方法(逻辑斯蒂回归)和非参数机器学习方法(随机森林和极限梯度提升树)建立了3个分类预测模型,并通过特征重要性排序、偏依赖图、累积效应图和SHAP值等模型分析手段对模型结果进行解释分析,从而探究热带雨林树木的死亡机制。研究结果表明,机器学习模型表现均优于传统的逻辑斯蒂回归模型,预测准确率达到90%以上,AUC值达到0.67以上,其中极限梯度提升树模型表现略优于随机森林模型。通过对模型的分析发现,BCI样地内树木死亡主要由树种功能性状,个体间相互作用,以及土壤化学特性等环境因素共同影响,具有非线性特征,而气候因素对于个体死亡的直接影响相对较小。此外,模型解释结果表明,种内竞争对个体存活率呈负影响,支持并揭示了Janzen-Connell假说。总竞争对存活率的影响呈单峰型分布,说明在BCI样地中,竞争和促进均在相邻植物之间进行。胸径大小和树木存活率呈负相关,一方面是由于邻域竞争负效应随胸径增大不断增大,另一方面可能是由于较大树木在热带雨林中更易受到雷电袭击,而年老的树木因为累积的历史性损伤更易死亡。土壤化学元素含量与树木存活率呈单峰型分布,表明竞争在低养分可用性情况下更激烈,验证了资源比率假说。幼苗生长率与树木存活率呈负相关,表明资源获取型的树木在防御方面投入较少,对病虫害的敏感性更低,更易受到同种负密度依赖作用的影响,表明了快速生长和防御之间的权衡。而平均木材比重、比叶重,以及树木平均高度与存活率呈正相关,可能是因为在高生产力森林中主要以资源获取型策略为主,保证树木分配足够的资源来生产更多的叶子和茎,并加强树冠来竞争光照。土壤侵蚀因子、坡度和海拔对存活率的影响为正效应,这与一些研究结果相反,可能是亚马逊地区的地形差异不大,往往被竞争、土壤养分等其他因素的影响所淡化,因为海拔的差异不像山地森林那样极端。本研究通过生态学大数据挖掘和机器学习手段,对热带雨林个体树木的死亡进行分析建模,揭示了Janzen-Connell假说、种间促进作用,快速生长和防御之间的权衡等生态学假说和理论,为复杂大型森林样地监测数据的挖掘和分析提供了新思路,也表明了大数据挖掘和机器学习方法在生态学中的广泛应用前景。