关键词:
激光诱导击穿光谱
特征谱线选择
水质检测
梯度提升树
摘要:
激光诱导击穿光谱技术(Laser-induced breakdown spectroscopy,LIBS)在用于物质检测时,光谱中包含了测量样品中所有可激发元素的多条原子线或离子线,谱线信息较为复杂,容易产生交叉重叠干扰。特别是用于水质检测时,由于受到液体样品溅射与波动的影响,光谱中存在大量冗余特征,这些都会对定量分析的稳定性造成影响。本文以Ca Cl溶液为实验样品,搭建以液体射流为进样方式的LIBS在线检测平台,研究特征谱线选择对LIBS水质检测稳定性的提高。主要内容包括:(1)LIBS在用于水质检测时,光谱中存在基线较高,噪声复杂、谱线强度量纲不统一等问题。为了减小误差,提高检测稳定性,对原始光谱进行基线校正、噪声消除、数据去量纲化、方差过滤和F检验等预处理。(2)由于水体溅射严重,波动较大,人工选择特征谱线结合单变量模型预测结果不理想。为了提高LIBS水质检测的稳定性,使用CART回归树进行特征谱线选择,通过CART回归树的变量选择,特征变量个数从100缩减到6,变量的压缩率达到了94%,显著降低了无关谱线的干扰。CART回归树模型的R,RMSEC,RMSEP和ARE分别为0.9975,0.0035wt.%,0.0061 wt.%和2.500%,ARSD减小到3.21%。对比单变量模型和偏最小二乘回归的预测结果,CART回归树模型不仅具有更加优秀的特征解释能力,而且相对标准偏差更低,表明其具有更高的预测稳定性。(3)单一的CART回归树模型稳定性不高,输入特征较多时,容易发生过拟合。为了解决以上问题,并提高LIBS在水质检测的稳定性,本章引入梯度提升树(Gradient-Boost Decision Tree,GBDT)分析混合溶液中Ca含量。对比单一CART回归树、随机森林回归(Random Forest Regressor,RFR)和GBDT的特征谱线选择结果和定量分析稳定性。GBDT的特征缩减率达到了94.8%,而且具有更加优秀的特征区分能力。GBDT模型的拟合系数R,RMSEC,RMSEP分别为0.999,0.001wt.%,0.003wt.%,ARE达到了2.45%,ARSD降低为3.37%,定量分析结果显著优于CART和RFR。上述结果证明了GBDT模型与LIBS结合并用于水质检测的可行性,基于Boosting思想的GBDT模型不仅可以准确的选择特征谱线,而且可以显著提高水质检测的稳定性。本文针对LIBS在用于水质检测时的不稳定性进行了相关的研究,引入CART回归树和GBDT模型对LIBS特征谱线进行选择。通过对比预测结果,表明CART回归树和GBDT模型可以有效的提高LIBS水质检测稳定性,为LIBS技术在水质检测领域的发展提供了有效的支持。