当前位置: 首页> 交通专利数据库 >详情
原文传递 基于回归系数二次函数激活的烟叶热水可溶物测定方法
专利名称: 基于回归系数二次函数激活的烟叶热水可溶物测定方法
摘要: 本发明公开了基于回归系数二次函数激活的烟叶热水可溶物测定方法。本发明检测烟叶原料的近红外光谱,采用索氏提取法准确测定烟叶原料的热水可溶物含量,整个检测样品集数据划分为训练集和测试集,基于训练集样本构建近红外光谱和热水可溶物含量的回归方程,记录回归系数图谱和矩阵,之后以二次U型函数作为激活函数,提取对热水可溶物含量贡献度较大的特征谱段,构建谱段提取后定量预测模型,从而快速、准确测定烟叶原料热水可溶物含量。本发明利用计算智能方法提取烟叶原料热水可溶物的近红外特征谱段并以此为基础快速测定热水可溶物含量,方法简单易行、操作简单、建立的表征方法更具客观性,对烟叶品质评价具有较好的指导性和实用性。
专利类型: 发明专利
国家地区组织代码: 云南;53
申请人: 云南中烟工业有限责任公司
发明人: 吴丽君;段如敏;王保兴;白晓莉;王颖琦;杨德忠;刘奇燕;朱杰
专利状态: 有效
申请日期: 2019-01-03T00:00:00+0800
发布日期: 2019-05-03T00:00:00+0800
申请号: CN201910005656.5
公开号: CN109709064A
代理机构: 昆明正原专利商标代理有限公司
代理人: 金耀生;亢能
分类号: G01N21/359(2014.01);G;G01;G01N;G01N21
申请人地址: 650231 云南省昆明市红锦路367号
主权项: 1.基于回归系数二次函数激活的烟叶热水可溶物测定方法,其特征在于,包括如下步骤: 步骤(1),样品的收集: 收集一批具有代表性的烟叶原料样品; 步骤(2),近红外光谱采集: 利用布鲁克MATRIX-I光谱仪采集步骤(1)收集到的烟叶的近红外光谱; 步骤(3),热水可溶物含量测定: 按现有方法测定步骤(1)中收集到的烟叶的热水可溶物含量; 步骤(4),训练和测试样本集划分: 采用Kennard-Stone方法随机划分步骤(2)采集的近红外光谱数据,2/3作为训练集,1/3作为测试集;将步骤(3)的热水可溶物含量作对应的训练集和测试集划分; 步骤(5),烟叶热水可溶物含量回归模型的建立: 将步骤(4)得到的训练集烟叶的近红外光谱数据和烟叶的热水可溶物含量数据利用PLS方法得到回归模型,具体如下: A、将已知烟叶的近红外光谱和热水可溶物含量数据对应列出,建立两类数据关联关系; B、运用PLS算法,构建烟叶热水可溶物含量回归模型; C、记录回归模型各光谱点的回归系数X-Loading矩阵,依据X-Loading形成回归系数图谱,得到各光谱点对于热水可溶物含量的贡献程度; 步骤(6),特征谱段提取: 以Y=X2二次函数作为谱段选择激活函数,各光谱点i对应的回归系数作为x,y=40000作为激活阈值,之后按照式(Ⅰ)判定该光谱点i是否被提取: ,式(Ⅰ) 步骤(7),烟叶热水可溶物含量定量预测模型构建: 基于步骤(6)提取的热水可溶物含量对应的贡献度较大的特征谱段,结合步骤(4)得到的训练集烟叶的近红外光谱数据和烟叶的热水可溶物含量数据,利用PLS方法构建定量预测模型,具体如下: A、将步骤(6)所提取的特征谱段对应的近红外光谱和热水可溶物含量数据对应列出,建立两类数据关联关系; B、运用PLS算法,构建烟叶热水可溶物含量定量预测模型; C、将步骤(4)中测试集烟叶原料经步骤(6)特征谱段提取后的近红外光谱数据作为输入变量进行外部预测验证; 步骤(8),测定烟叶原料热水可溶物含量: 将待测定烟叶原料的近红外光谱输入步骤(7)建立的热水可溶物含量定量预测模型,即可快速测定得到热水可溶物含量。 2.根据权利要求1所述的方法,其特征在于:步骤(1)中,所述的烟叶原料样品形态包括粉末或8mm碎片,针对两类样品形态均直接进行近红外光谱采集和热水可溶物含量测定。 3.根据权利要求2所述的方法,其特征在于:所述步骤(2)的近红外光谱是通过下列方法获得的: 将步骤(1)收集的两类烟叶原料样品,每个样品取五个平行样,每个平行样取200g,粉末样品放入小样品杯中,8mm碎片放入大样品杯中,均平铺于样品杯中,保证样品平整放置,厚度为2~3cm,用压样器轻压平整后,放到光谱仪旋转台上,采用漫反射的方式进行扫描并采集光谱,每个平行样扫一次光谱,每个样品对应5条平行光谱;针对5条平行光谱,利用马氏距离分析每条光谱偏离均值的程度,进而利用卡方分布评估每条光谱检测异常的风险水平,将风险水平超标的光谱剔除后,再将剩余光谱进行求平均得到一个平均光谱,依次对每个样品采用相同的方法进行扫描并计算光谱,得到每个样品对应的平均光谱。 4.根据权利要求1所述的方法,其特征在于:步骤(4)中,所述的训练集和测试集是通过下列方法划分得到的: 针对步骤(2)采集的近红外光谱,首先计算两两样本之间距离,选择距离最大的两个样品,然后分别计算剩余的样本与已选择的两个样本之间的距离,对于每个剩余样本而言,其与已选样品之间的最短距离被选择,然后选择这些最短距离中相对最长的距离所对应的样本,作为第三个样品; 重复上述步骤,直至所选的样品的个数等于2/3样本集的数目为止,作为训练集;剩余1/3样品作为测试集。 5.根据权利要求1所述的方法,其特征在于:步骤(5)中,所述的回归模型是基于近红外光谱全谱段构建了与热水可溶物含量的关联关系,确定了每个光谱点i的回归系数;针对全谱段构建了1×n的回归系数X-Loading矩阵,n为光谱点个数,通过X-Loading矩阵形成回归系数图谱,得到各光谱点对于热水可溶物含量的贡献程度。 6.根据权利要求1所述的方法,其特征在于:步骤(7)中,烟叶热水可溶物含量定量预测模型构建的具体方法如下: (1)光谱预处理:针对每个样品平均光谱进行二阶导数、小波平滑和中心化预处理; (2)用偏最小二乘法将经过特征谱段提取后的光谱数据与其对应的热水可溶物测定数据进行拟合,根据Press值曲线的斜率变化程度自动选取建模主成分个数; (3)根据构建的定量预测模型对测试集样本进行预测验证: 通过计算均方根误差的方法,确定测试样品集在定量预测模型中所得的预测值与相应的步骤(3)测定所得的参考值之间的偏差;依据热水可溶物含量标准测定方法,如果RMSE≤1,说明模型预测误差在允许范围之内,模型验证成功,该模型可用于测定烟叶原料的热水可溶物含量。
所属类别: 发明专利
检索历史
应用推荐