主权项: |
1.一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,其特征在于,按照下述步骤进行: 步骤一:将多种互不发生化学反应的农药分别配制为统一浓度的溶液,然后将各农药溶液按照不同的体积比进行混合,将混合农药溶液与合成的表面增强拉曼基底混合,采集混合农药溶液的表面增强拉曼光谱; 步骤二:对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选; 步骤三:将筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测。 2.根据权利要求1所述的一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,其特征在于,所述步骤二对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选,按照下述步骤进行: (1)将采集到的表面增强拉曼光谱按照Kennard-Stone算法划分为校正集与预测集,并将所有表面增强拉曼光谱的光谱区间划分为K个等宽的子区间,将校正集中的表面增强拉曼光谱数据定义为矩阵Xm×K,其中,m代表校正集中表面增强拉曼光谱的数量,K代表子区间;定义校正集中混合农药溶液中各农药含量的真实值矩阵Ym×l,该矩阵中的值即为步骤一中配制的混合农药溶液中各农药的体积比,其中,m代表校正集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量,矩阵的每行元素依次放置各个农药的体积比; (2)对校正集中表面增强拉曼光谱的K个子区间进行随机组合,每次随机组合的实现过程为:采用加权自举采样方法对K个子区间进行R次有放回的加权采样,如果首次执行步骤(2),则R等于K,并且每个子区间被分配的采样权重为1/K,完成1次随机组合即可获得1个子数据集,该子数据集即为子区间的随机组合,对K个子区间进行M次随机组合,可获得M个子数据集; (3)根据M个子数据集,即表示表面增强拉曼光谱K个子区间的M种随机组合,在该数据集的基础上构建多元回归模型对混合农药溶液中各农药含量进行预测,并求出预测值的均方根误差,其步骤如下: ①根据子数据集中子区间的组合,从矩阵Xm×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵X’m×n,m代表校正集中表面增强拉曼光谱的数量,n代表该子数据集中的子区间; ②采用偏最小二乘回归算法SIMPLS,求得矩阵Xm×K与矩阵Ym×l的回归系数Q,根据求得的回归系数Q及矩阵X’m×n,求得Y’m×l=Q*X’m×n,则矩阵Y’m×l代表混合农药溶液中各农药含量的预测值; ③由混合农药溶液中各农药含量的真实值矩阵Ym×l与预测值矩阵Y’m×l,根据公式(1)可求得混合农药溶液中各农药含量的预测值的均方根误差: 其中,yi,j代表混合农药溶液中各农药含量的真实值,y’i,j代表混合农药溶液中各农药含量的预测值,在M个子数据集的基础上可得M个预测值的均方根误差值(RMSE1,RMSE2,RMSE3,…,RMSEM),从M个子数据集中选取M*σ个具有较小的均方根误差值的子数据集做进一步分析,其中,σ为参数,0<σ<1; (4)计算并记录M*σ个子数据集的均方根误差值的平均值,定义为:RMSEmean; (5)根据公式(2)更新每个子区间的采样权重: 其中,wi代表第i个子区间的采样权重,fi代表第i个子区间在M*σ个子数据集中出现的频率,其中,i的范围为:1≤i≤K,同时,计算M个子数据集中所包含的子区间个数的平均值取整,进而采用该平均值对步骤(2)中加权自举采样方法的有放回次数R进行更新; (6)进入迭代过程:重复步骤(2)-(6),观察RMSEmean的变化趋势,如果RMSEmean呈下降趋势,则继续迭代过程;相反,如果RMSEmean呈上升趋势,则迭代过程终止,进入步骤(7); (7)找到最小的RMSEmean所对应的子数据集,其中的子区间组合即为最优的表面增强拉曼光谱特征谱带区间。 3.根据权利要求1所述的一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,其特征在于所述步骤三将步骤二中筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测,按照下述步骤进行: (1)将预测集中的表面增强拉曼光谱数据定义为矩阵Ac×K,其中,c代表预测集中表面增强拉曼光谱的数量,K代表子区间; (2)根据步骤二筛选得到的最优的表面增强拉曼光谱特征谱带区间,从矩阵Ac×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵A’c×d,其中,c代表预测集中表面增强拉曼光谱的数量,d代表筛选得到的最优的表面增强拉曼光谱特征谱带区间,利用步骤二中获得的回归系数Q,计算得到Bc×l=Q*A’c×d,矩阵Bc×l即为混合农药溶液中各农药含量的预测值,其中,c代表预测集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量。 |