专利名称: | 一种基于KNN的近红外异常光谱识别方法 |
摘要: | 本发明公开了一种基于KNN的近红外异常光谱识别方法,以针对近红外光谱分析中,异常光谱数据的存在严重影响到光谱分析模型的准确性和可靠性的问题。方法步骤包括:选择相似性度量、选择超参数k、计算光谱间距离度量、找出k最短距离样本、计算样本异常度量、样本按异常度量排序、识别和剔除异常度量高样本。本发明主要用于构建近红外光谱分析模型的中异常光谱的识别和剔除。 |
专利类型: | 发明专利 |
国家地区组织代码: | 江苏;32 |
申请人: | 盐城工学院 |
发明人: | 刘聪;徐友武;阳程 |
专利状态: | 有效 |
申请号: | CN201710793823.8 |
公开号: | CN109459409A |
分类号: | G01N21/359(2014.01)I;G;G01;G01N;G01N21 |
申请人地址: | 224051 江苏省盐城市亭湖区希望大道1号 |
主权项: | 1.基于KNN的近红外异常光谱识别方法,其特征在于,包括以下主要步骤:(1) 选择某种距离度量d( , )作为近红外光谱样本间的相似性度量;(2) 选择超参数k,异常值识别研究中,k值的确定需根据经验决定,尝试若干个k值,选择识别效果较好的k值,本研究中选择k=5;(3) 计算光谱样本和其他所有样本的距离d(,),‑1,+1,…,n,n为总样本数;(4) 找出和样本xi距离最短的k个样本;(5) 把xi和第k个样本的距离作为样本xi的异常值度量,或者把和xi最近的k个样本距离加权累加后作为样本的异常度量,前者可看作是后者的特例;(6) 回到步骤(3),计算其它每一个近红外光谱样本的异常度量;(7) 将所有近红外光谱样本按照其异常度量从高到低的次序进行排序;(8) 在异常度量最高的序列前端中识别出异常光谱数据。 |
所属类别: | 发明专利 |