当前位置: 首页> 交通专利数据库 >详情
原文传递 一种模糊极大熵聚类的茶叶近红外光谱分类方法
专利名称: 一种模糊极大熵聚类的茶叶近红外光谱分类方法
摘要: 本发明公开了一种模糊极大熵聚类的茶叶近红外光谱分类方法,包括以下步骤:S1,茶叶样本近红外光谱采集:用傅里叶近红外光谱仪对茶叶样本进行检测,获取茶叶样本近红外漫反射光谱数据。S2,用多元散射矫正(MSC)对茶叶近红外光谱进行预处理。S3,对茶叶样本近红外光谱进行降维处理和鉴别信息提取:利用主成分分析(PCA)将在S2中获得的茶叶近红外光谱数据压缩;然后利用线性判别分析(LDA)提取茶叶样本的鉴别信息。S4,对S3中包含鉴别信息的测试样本用模糊极大熵聚类方法进行茶叶品种分类。本发明解决了用传统模糊极大熵聚类对噪声敏感问题。本发明具有检测速度快、无损检测、能处理含噪声的光谱数据,茶叶品种分类准确率高等优点。
专利类型: 发明专利
国家地区组织代码: 江苏;32
申请人: 江苏大学
发明人: 武小红;郭庭硕;武斌;孙俊;戴春霞;陈勇;傅海军
专利状态: 有效
申请日期: 2019-04-22T00:00:00+0800
发布日期: 2019-08-09T00:00:00+0800
申请号: CN201910321670.6
公开号: CN110108661A
分类号: G01N21/3563(2014.01);G;G01;G01N;G01N21
申请人地址: 212013 江苏省镇江市京口区学府路301号
主权项: 1.一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,包括如下步骤: S1,采集茶叶近红外光谱; S2,对茶叶近红外光谱进行预处理; S3,对茶叶近红外光谱进行降维处理和鉴别信息提取; S4,对S3中包含鉴别信息的茶叶采用模糊极大熵聚类方法进行茶叶品种分类。 2.根据权利要求1所述的一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,所述S1的具体实现方法:用傅里叶近红外光谱仪对茶叶样本进行检测,获取茶叶样本近红外漫反射光谱数据。 3.根据权利要求1所述的一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,所述S2的具体实现方法:采用多元散射矫正(MSC)对茶叶近红外光谱进行预处理。 4.根据权利要求1所述的一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,所述S3的实现是采用主成分分析(PCA)将在S2中获得的茶叶近红外光谱数据压缩;然后利用线性判别分析(LDA)提取茶叶样本的鉴别信息。 5.根据权利要求4所述的一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,所述S3的具体实现方法:将S2中的光谱用主成分分析计算特征值和特征向量,将特征值从大到小排列,取前10个最大特征值对应的10个特征向量,将所有茶叶样本的近红外光谱数据投影到这10个特征向量上,将近红外光谱从1557维压缩到10维;将这10维光谱数据分为两个部分:从每类茶叶样本中选取一部分样本组成茶叶样本训练集,剩余样本组成茶叶样本测试集,用线性判别分析计算茶叶样本训练集的特征值和特征向量,取前2个最大特征值对应的2个特征向量,将茶叶样本测试集投影到这2个特征向量上得到经过线性判别分析处理后的二维数据。 6.根据权利要求1所述的一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,所述S4的具体实现方法: S4.1,初始化:设置权重指数m,类别数c,其中m>1;设置参数λ(λ>0)和β(β>0);设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;以S3中包含鉴别信息的训练样本的均值作为初始类中心值νi(0),计算茶叶近红外光谱测试样本的协方差σ2: 这里xk为第k(k=1,2,3,…,n)个样本,n为测试样本数。为样本的均值, S4.2,计算第r(r=1,2,…,rmax)次迭代时的模糊隶属度值uik(r): uik是xk隶属于第i类的模糊隶属度值,uik(r)是第r次迭代计算得到的uik;vi是第i(i=1,2,3,…,c)类的类中心值,νi(r-1)是第r-1次迭代时得到的类中心vi的值;vj是第j(j=1,2,3,…,c)类的类中心值,νj(r-1)是第r-1次迭代时得到的类中心vj的值;n为测试样本数;c为类别数;λ是参数。 S4.3,计算第r次迭代时第i类的类中心值νi(r):其中νi(r)是第r次迭代计算的类中心vi的值;由c个νi(r)构成矩阵V(r)=[ν1(r),ν2(r),…,νc(r)]。 S4.4,循环计数增加,即r=r+1;若满足条件:||V(r)-V(r-1)||<ε或r>rmax则计算终止,否则继续S4.2,根据计算得到的模糊隶属度值,实现茶叶品种分类。 7.根据权利要求6所述的一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,所述S4.1中,权重指数m=2,类别数c=3;参数λ=10;β=10;rmax=100;ε=0.00001。 8.根据权利要求1所述的一种模糊极大熵聚类的茶叶近红外光谱分类方法,其特征在于,所述S1的实现还包括:将近红外光谱分析仪开机预热1个小时,采用反射积分球模式采集茶叶近红外光谱,近红外光谱分析仪扫描每个样品32次以获取样品的漫反射光谱均值,光谱扫描的波数为4000~10000cm-1,扫描间隔为3.857cm-1,采集到每个茶叶样品的光谱是1557维的数据,每个样本采样3次,取其平均值作为后续模型建立的数据。
所属类别: 发明专利
检索历史
应用推荐