论文题名: | 基于生成对抗网络的异常检测算法研究 |
关键词: | 异常检测;生成对抗网络;混合采样;编码器;解码器 |
摘要: | 异常对象是数据分析的一个重要概念,如果数据对象与特定域中的公共数据行为的规则模式有明显的偏差,则认为它是异常对象。一般来说,这意味着该数据对象与数据集中的其他观测值“不同”。在数据分析过程中对这些对象进行检测,以区别于其他数据是非常重要的一步。目前异常检测技术广泛应用在工业产品无损检测、网络入侵检测、数据泄露以及网络欺诈等领域。因此,研究异常检测技术具有重大意义,本文主要研究了基于生成对抗网络的异常检测算法。 生成对抗网络(GAN)一种非监督学习模型,它打破了以往监督学习依赖大量标签耗时耗力的缺点,并且在异常检测领域中通过其对抗机制大大提高了检测效率以及检测准确度。因此本文将生成对抗网络和编码网络相结合构建异常检测模型,并通过实验验证了该方法能够在复杂的数据环境下准确识别异常样本。其次,将生成对抗网络和混合变量采样技术相结合,进一步研究了基于生成对抗网络的异常检测问题,具体研究内容如下: (1)提出了基于双编码解码与生成对抗网络的异常检测模型(DED-GAN)。基于生成对抗网络进行异常检测的经典方法中,使用了由编码器、解码器构成的生成器学习图像在潜在空间的数据分布,并了解到该潜变量在计算异常分值时起到关键作用。在此基础上,对编码和解码网络做进一步研究,通过设计新的网络结构,以获得对计算异常分值更加合适的潜变量。因为异常分值函数会直接影响异常检测的结果,所以本课题结合新的损失内容、新的网络结构,设计性能更好的异常分值函数,此外在研究的过程中考虑了新的损失内容,以及各种损失之间的关系,并据此构建新的损失函数,进一步提高异常检测的准确率。最后,通过实验操作将该模型的异常检测结果和多种传统的异常检测结果进行了对比,结果表明DED-GAN模型的异常检测精准度明显优于其他方法。 (2)提出了基于混合变量采样与生成对抗网络的异常检测模型(E-GAN)。该模型将离散编码和连续编码结构结合,把高维数据映射成低维混合数据,并通过对低维空间中的混合变量采样获得用于训练生成器的输入数据。生成器利用采样后的数据准确学习正常数据的分布,并在检测过程中利用样本数据在潜在空间中的变化情况,分析并识别异常样本。在E-GAN模型结构的基础上,进一步研究了基于潜变量的异常分值函数的构建,通过结合新的损失内容、新的网络结构,设计性能更好的异常分值函数并利用实验验证E-GAN的优势。 |
作者: | 刘慧 |
专业: | 信息与通信工程 |
导师: | 吴义熔;唐庭龙 |
授予学位: | 硕士 |
授予学位单位: | 三峡大学 |
学位年度: | 2021 |