当前位置: 首页> 交通专利数据库 >详情
原文传递 一种提高小麦水分预测精度的近红外光谱变量选择方法
专利名称: 一种提高小麦水分预测精度的近红外光谱变量选择方法
摘要: 本发明涉及一种提高小麦水分预测精度的近红外光谱变量选择方法,属于农业分析领域。具体实施过程如下:首先采集小麦的近红外光谱数据,测量小麦水分化学值含量;其次,通过二进制矩阵采样法对光谱变量空间进行随机采样,将变量出现频率和偏最小二乘回归系数两种信息向量做加权处理得到每个光谱变量的贡献值,采用指数衰减函数删除贡献值小的变量,生成新的变量空间;最后,基于新的变量空间,采用加权采样法生成新的子集,建立回归子模型,利用模型的回归系数绝对值,得到子集中每个变量的权重,逐步校正优化变量权重,得到最优变量集,以此建立小麦水分预测模型。该方法与现有技术相比较,提高了模型的预测精度及稳定性。
专利类型: 发明专利
国家地区组织代码: 吉林;22
申请人: 长春理工大学
发明人: 宦克为;孙大明;刘小溪;韩雪艳;赵环
专利状态: 有效
申请日期: 2019-07-30T00:00:00+0800
发布日期: 2019-10-22T00:00:00+0800
申请号: CN201910693888.4
公开号: CN110361356A
代理机构: 长春市吉利专利事务所
代理人: 李晓莉
分类号: G01N21/3563(2014.01);G;G01;G01N;G01N21
申请人地址: 130022 吉林省长春市卫星路7089号
主权项: 1.一种提高小麦水分预测精度的近红外光谱变量选择方法,其特征在于,包含以下步骤: A测量小麦样本的近红外光谱数据X和小麦水分含量化学值数据Y,运用Kennard-Stone算法分为校正集和预测集; B通过二进制矩阵采样法从变量空间中采样K次,得到K个变量子集,每一个变量子集都含有一组随机的变量组合,其中K值为1500; C利用偏最小二乘法计算出每个变量组合的交互检验均方根误差,并选取其交互检验均方根误差最小的前σ×K个变量子集作为变量集,其中σ值取15%; D统计变量集中每个变量出现的频率并进行归一化处理,进而得到了一个变量重要性判断依据称为第一类信息向量,归一化处理后的变量出现频率值为在以第一类信息向量为判定标准下的变量贡献值; E计算出步骤C中所述变量集中每个变量在不同的变量子集中的偏最小二乘回归系数的绝对值,并进行归一化处理,最后对变量集中每个变量在不同变量子集中的归一化回归系数绝对值进行求和,变量归一化回归系数绝对值之和的大小与变量的重要性成正比,进而得到第二个变量重要性判据称为第二类信息向量,每个变量在不同变量子集中的归一化回归系数绝对值和为该变量在以第二类信息向量为判定标准下的变量贡献值; F根据每种信息向量的交互检验均方根误差设置第一类信息向量和第二类信息向量的权重; G根据第一类信息向量和第二类信息向量的权重,计算出变量集中每个变量的贡献值; H运用指数衰减函数删除利用步骤G计算出的贡献值小的变量,保留利用步骤G计算出的贡献值大的变量,得到一个新的变量空间R; I将变量空间R中的变量重复执行步骤B~步骤H进行变量筛选,此过程迭代N次,N值为50,在迭代过程中保留交互检验均方根误差值小的集合,最终剩下L个变量,L值为100; J对剩余的L个变量采用自助随机采样方法进行采样,生成相互不完全相同的Z个子集,Z值为500,Z个子集中的所有变量具有相同的选取概率权重; K用步骤J中获得的Z个子集建立子模型,计算子模型的交叉验证均方根误差,提取出交叉验证均方根误差最小的15%的最佳模型; L计算步骤K中提取的每个最佳模型的回归系数,得到每个最佳模型的回归矢量,将上述回归矢量中所有回归系数转换为绝对值的形式,得到二次回归矢量,把所有二次回归矢量进行归一化得到最终回归矢量,并对最终回归矢量进行求和,根据最终回归矢量求和的结果,赋予每个变量新的权重; M基于每个变量的新权重,应用加权采样去生成相互不完全相同的新的子集,并构建新的子集的子模型,在新的子集的子模型中,令回归系数绝对值越大的变量的选择概率值越大; N将J~M步骤迭代运行N次,N值为50,在迭代过程中将交叉验证均方根误差值最小的子集作为最优变量集,以最优变量集建立小麦水分预测模型。 2.根据权利要求1中所述一种提高小麦水分预测精度的近红外光谱变量选择方法,其特征在于,所述步骤F中的第一信息向量权重和第二信息向量权重的计算公式: w1:第一类信息向量的权重;w2:第二类信息向量的权重;RMSECV1:第一类信息向量的交互检验均方根误差;RMSECV2:第二类信息向量的交互检验均方根误差; 所述步骤G中所述变量集中每个变量的贡献值的计算公式: Yi:第i个变量的贡献值,其值越大则该变量越重要;第i个变量在以第一类信息向量为判定标准下的变量贡献值;第i个变量在以第二类信息向量为判定标准下的变量贡献值。
所属类别: 发明专利
检索历史
应用推荐