专利名称: |
一种基于生成对抗网络的半监督高光谱数据定量分析方法 |
摘要: |
本发明公开一种基于生成对抗网络的半监督高光谱数据定量分析方法,其步骤如下:(1)获取高光谱样本数据;(2)构建样本训练集与预测集,其中无标签的预测集样本也用于半监督训练;(3)构建基于生成对抗网络的回归网络,包括一个生成样本的生成器网络,和一个同时具有判别样本真伪与输出定量分析值功能的判别器/回归器网络;(4)构建生成对抗网络的损失函数,包括判别器损失函数,回归器损失函数,及具备样本分布匹配功能的生成器损失函数;(5)训练生成对抗网络;(6)采用训练好的回归器进行定量分析值的预测。本发明采用生成对抗网络来生成样本,并使用样本分布匹配策略来补充现有无标签样本集,提升了高光谱定量分析的精度。 |
专利类型: |
发明专利 |
国家地区组织代码: |
广东;44 |
申请人: |
广东省智能制造研究所 |
发明人: |
刘忆森;周松斌;李昌;韩威;黄可嘉;刘伟鑫;邱泽帆 |
专利状态: |
有效 |
申请日期: |
2019-05-20T00:00:00+0800 |
发布日期: |
2019-10-11T00:00:00+0800 |
申请号: |
CN201910420079.6 |
公开号: |
CN110320162A |
代理机构: |
广州容大专利代理事务所(普通合伙) |
代理人: |
刘新年;潘素云 |
分类号: |
G01N21/25(2006.01);G;G01;G01N;G01N21 |
申请人地址: |
510070 广东省广州市先烈中路100号大院15号楼 |
主权项: |
1.一种基于生成对抗网络的半监督高光谱数据定量分析方法,其特征在于,包括如下步骤: S1.获取有标签的高光谱样本数据及无标签的高光谱样本数据; S2.构建样本训练集与预测集:将有标签的高光谱样本数据集Dlabel作为训练集,无标签的高光谱样本数据集Dunlabel作为预测集; S3.构建基于生成对抗网络的回归网络: S3-1.构建一个由全连接层、卷积层、上采样层、输出层组成的生成器网络; S3-2.构建一个由卷积层、池化层、输出层组成的判别器/回归器网络,该网络具有判别数据真伪与定量分析值两个输出; S4.构建生成对抗回归网络的损失函数: S4-1.判别器/回归器的损失函数为有标签样本和无标签样本损失函数之和,其中无标签样本损失函数为真实无标签样本损失函数(Lunlabel_real)与生成样本损失函数(Lunlabel_fake)之和: LD=Lsupervised+Lunsupervised Lunsupervised=Lunlabel_real+Lunlabel_fake S4-2.生成器的损失函数为生成样本的损失函数(L′unlabel_fake)与样本分布匹配损失函数(Ldistribution)之和: LG=L′unlabel_fake+Ldistribution 其中样本分布匹配损失函数,是为了使生成样本和真实样本在样本空间中互为补集,从而达到抑制过拟合效果; S5.训练基于生成对抗的回归网络: 采用梯度下降方法,交替训练判别器/回归器与生成器,直到训练集样本的定量分析预测值与标签值的均方根误差收敛至小于一个阈值或训练步数大于一个阈值; S6.采用训练好的生成对抗网络中的回归器得到预测集的定量分析预测值。 2.根据权利要求1所述的基于生成对抗网络的半监督高光谱数据定量分析方法,其特征在于,步骤S2中构建样本训练集与预测集步骤包括: S2-1.将由标签样本作为训练集样本,无标签样本作为预测集样本,同时也用于半监督的训练; S2-2.在每个训练集和预测集的高光谱样本数据块中随机取m次n个有效像素光谱曲线的均值,作为样本增强,得到的有标签和无标签平均光谱数据集记为Dlabel和Dunlabel。 3.根据权利要求1所述的基于生成对抗网络的半监督高光谱数据定量分析方法,其特征在于,步骤S3-1中所述生成器网络依次由:全连接层—上采样层—卷积层—上采样层—卷积层—输出层构成,其中全连接层节点数为16*光谱波段数,卷积层为一维卷积,卷积核尺寸为1×5,卷积核个数取值范围为16~128,上采样层为2倍上采样,输出层节点数与光谱波段数相同,除输出层外非线性激励函数为ReLU,输出层非线性激励为sigmoid函数。 4.根据权利要求1所述的基于生成对抗网络的半监督高光谱数据定量分析方法,其特征在于,步骤S3-2中所述判别器/回归器网络依次由:卷积层—池化层—卷积层—池化层—卷积层—池化层—输出层构成,其中卷积层为一维卷积,卷积核尺寸为1×5,卷积核个数取值范围为16~128,池化层为1/2下采样,输出层为2个,其中一个输出判别器结果,即光谱数据真伪预测值,另一个输出回归器结果,即定量分析预测值,除输出层外非线性激励函数为leakyReLU,两个输出层非线性激励为sigmoid函数。 5.根据权利要求1所述的基于生成对抗网络的半监督高光谱数据定量分析方法,其特征在于,步骤S4-1中所述判别器/回归器的损失函数为有标签样本损失函数、无标签样本损失函数、和生成样本损失函数三个部分之和,其中有标签样本损失函数为有标签样本的定量分析预测值与定量标签值的均方误差: 无标签样本损失函数为判别器预测值与真伪标签的交叉熵: 生成样本损失函数为判别器预测值与真伪标签的交叉熵: 6.根据权利要求1所述的基于生成对抗网络的半监督高光谱数据定量分析方法,其特征在于,步骤S4-2中所述生成器损失函数为生成样本的损失函数与样本分布匹配损失函数之和,其中生成样本的损失函数为生成器生成样本经过判别器的预测值与真伪标签的交叉熵;生成器与判别器中的生成样本真伪标签相反,从而使生成器与判别器形成对抗: 样本分布匹配损失函数为: 其中为回归器预测得到的当前训练批次的无标签样本定量分析值分布,为回归器预测得到的当前训练批次的生成样本定量分析值分布。 7.根据权利要求6所述的基于生成对抗网络的半监督高光谱数据定量分析方法,其特征在于,无标签样本定量分析值分布与生成样本定量分析值分布计算步骤为: S4-2-1.由回归器预测当前训练批次的无标签样本与生成样本定量分析值,分别为和 S4-2-2.将样本定量分析值的分布近似为k项的多项分布,将和近似到k个水平,然后通过计数得到概率分布和 |
所属类别: |
发明专利 |