专利名称: |
基于最小二乘支持向量机的远安黄茶闷黄时间的无损预测方法 |
摘要: |
基于最小二乘支持向量机的远安黄茶闷黄时间的无损预测方法,包括:鲜叶样品采集与分类;扫描获得不同闷黄时间鲜叶样品的近红外光谱;对样品光谱进行预处理剔除噪声信息后,将样品光谱转化为成对的数据点;再将全部光谱数据均划分为20个子区间,分别建立每个子区间数据的最小二乘支持向量机方法模型,筛选出建模的最佳子区间数据;应用主成分分析法抽提、压缩最佳光谱子区间信息;以主成分得分为输入值,不断调整神经元个数和传递函数,建立general regression结构人工神经网络预测模型;模型稳健性检验。实现了黄茶样品闷黄时间的快速、准确、客观预测,起到提高预测闷黄时间准确度和增强模型实用性的目的。 |
专利类型: |
发明专利 |
国家地区组织代码: |
湖北;42 |
申请人: |
湖北省农业科学院果树茶叶研究所 |
发明人: |
王胜鹏;龚自明;高士伟;郑鹏程;滕靖;叶飞;王雪萍;郑琳;刘盼盼 |
专利状态: |
有效 |
申请日期: |
2019-06-14T00:00:00+0800 |
发布日期: |
2019-10-08T00:00:00+0800 |
申请号: |
CN201910513175.5 |
公开号: |
CN110308110A |
代理机构: |
武汉市首臻知识产权代理有限公司 |
代理人: |
王春娇 |
分类号: |
G01N21/359(2014.01);G;G01;G01N;G01N21 |
申请人地址: |
430064 湖北省武汉市洪山区南湖大道10号 |
主权项: |
1.基于最小二乘支持向量机的远安黄茶闷黄时间的无损预测方法,其特征在于,扫描获得不同闷黄时间鲜叶样品的近红外光谱,对样品光谱进行预处理剔除噪声信息后,样品光谱转化为成对的数据点;再将全部光谱数据均划分为20个子区间,分别建立每个子区间数据的最小二乘支持向量机方法模型,筛选出建模的最佳子区间数据;再应用主成分分析法对光谱数据信息进行压缩抽提,以主成分得分为输入数值,通过调节隐含层神经元个数和信息传递函数,建立黄茶不同闷黄时间样品的人工神经网络预测模型,用于预测黄茶的闷黄时间,具体包括以下步骤: 步骤一、鲜叶样品采集与分类 采集湖北省远安县安吉白茶品种单芽、一芽一叶和一芽二叶三个不同部位鲜叶样品,经杀青后对样品进行闷黄,同时精准记录闷黄时间;根据闷黄时间不同,将样品分为校正集和验证集2个集合,其中校正集样品用于建立不同闷黄时间的近红外光谱校正模型,验证集样品用于对校正集预测模型稳健性进行检验; 其中,一芽一叶由单芽、第一叶和较长梗构成,一芽二叶由单芽、第一叶、第二叶和长梗构成; 步骤二、光谱扫描 应用傅里叶变换型近红外光谱仪扫描获得全部闷黄样品的近红外光谱,光谱扫描范围4000-10000cm-1、分辨率8cm-1、检测器为InGaAs,每个样品采集3次光谱、每次扫描64次,然后对3次采集的光谱进行平均,以平均光谱作为该样品的最终光谱; 步骤三、光谱噪声信息预处理 应用多款化学计量学软件对步骤二中扫描得到的近红外光谱采用矢量归一化方法进行去噪声预处理,提高建模时光谱的信噪比,有利于建立稳健的预测模型;光谱去噪声后,再将样品光谱转化为成对的数据点; 步骤四、光谱子区间划分 将全部光谱信息数据均等分为20个光谱信息子区间,精准筛选反映样品闷黄时间的光谱信息子区间,用于后续建立最小二乘支持向量机模型; 步骤五、最小二乘支持向量机(LS-SVM)模型建立 本发明应用LS-SVM方法分别建立每个光谱信息子区间的预测模型,比较模型相关系数(correlation coefficient of calibration,Rc)和交互验证均方根方差(root meansquare error of calibration,RMSECV)大小,初步筛选出建模的最佳光谱信息子区间数据,达到精准筛选反映闷黄时间的光谱信息的目的,其中,Rc最大、RMSECV最小,表示建立的最小二乘支持向量机模型结果最佳, 其中,RMSECV计算公式为: Rc计算公式为: 式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,为样品集中第i个样品的实测值的平均值,式中i≤n; 步骤六、general regression结构人工神经网络预测模型建立 应用非线性的人工神经网络方法进一步精准预测样品的闷黄时间,包括: 1)最佳光谱信息子区间主成分分析 采用主成分分析方法(PCA)对筛选的最佳光谱信息子区间数据进行主成分分析,得到每个主成分的单独贡献率值、累计贡献率值和主成分得分;在主成分累计贡献率≥85%才可以有效代表样品建模光谱子区间信息; 2)人工神经网络预测模型建立 以最佳光谱信息子区间的主成分得分为输入值、以样品不同闷黄时间为输出值,应用Neuro Shell2软件建立general regression结构的人工神经网络预测模型,generalregression结构人工神经网络结构信息传递方式包含2个隐含层、不同的神经元以及不同的信息传递函数,比较模型相关系数(correlation coefficient of calibration,Rc)和交互验证均方根方差(root mean square error of calibration,RMSECV)大小,得到最佳近红外光谱预测模型,其中,Rc越大、RMSECV越小,表示模型预测效果越好; 其中RMSECV计算公式为: Rc计算公式为: 式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,为样品集中第i个样品的实测值的平均值,式中i≤n; 其中以相关系数Rc最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型; 步骤七、模型稳健性检验 应用全部验证集样品对不同闷黄时间的人工神经网络预测模型效果进行检验,所得结果用相关系数(correlation coefficient of prediction,Rp)和验证均方差(root meansquare error of prediction,RMSEP)表示,其中Rp越大、RMSEP越小则表示模型稳健性越好,可以准确的预测样品的闷黄时间; 其中RMSEP计算公式为: Rp计算公式为: 式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,式中i≤n。 2.根据权利要求1所述的基于最小二乘支持向量机的远安黄茶闷黄时间的无损预测方法,其特征在于:所述的步骤一中鲜叶样品数量为120份,鲜叶样品按照3:1的比例划分为校正集和验证集,其中校正集样品90个、验证集样品30个。 3.根据权利要求1所述的基于最小二乘支持向量机的远安黄茶闷黄时间的无损预测方法,其特征在于:所述步骤五中筛选出建模的最佳光谱信息子区间数据为6406.4-6703.4cm-1。 4.根据权利要求1所述的基于最小二乘支持向量机的远安黄茶闷黄时间的无损预测方法,其特征在于:所述步骤六中在采用主成分分析方法(PCA)进行主成分分析时,采用前3个主成分代表最佳光谱子区间的光谱信息。 5.根据权利要求1所述的基于最小二乘支持向量机的远安黄茶闷黄时间的无损预测方法,其特征在于:所述步骤六中选择4个神经元和logistic信息传递函数建立不同闷黄时间样品的general regression结构人工神经网络模型。 |
所属类别: |
发明专利 |