主权项: |
1.一种基于改进深度极限学习机的虚拟水质监测方法,其特征在于:该方法包括以下步骤:步骤1:对水质监测网络采集的水质参数含量数据进行空间相关性分析,确定对未知位置进行插值所需要利用的站点,详细过程如下:1)计算相关系数ρX,Y,具体计算如下:式(1)中N为样本总量,Xi,Yi分别为两个样本的实际观测值,分别为两个样本数据的均值;2)根据计算出的所有站点之间的相关系数,得到与需要预测站点处相关性较大的站点,即ρX,Y>0.6时,呈强相关程度及其以上的站点;步骤2:样本进行预处理:所述样本为与预测站点具有强相关程度及以上的若干个监测站点所监测的水质参数值,将数据集按照“留出法”划分成训练集和测试集;采用最大最小法分别对训练集和测试集进行归一化处理,转化为[0,1]之间的值;步骤3:初始化改进的深度极限学习机模型结构:模型主要由两部分构成,第一部分是通过堆叠基于极限学习机的降噪收缩自编码器构成,第二部分是加权极限学习机;其中第一部分中的降噪收缩自编码器数量m为3,各降噪收缩自编码器中隐藏层中的神经元个数为8,激活函数g(x)为sigmod函数,引入的噪声为高斯噪声;步骤4:采用无监督逐层贪婪预训练算法对堆叠的降噪收缩自编码器进行训练,对于每一个降噪收缩自编码器的输出权重均采用下述过程进行计算:1)对输入样本X利用高斯噪声进行干扰得到加噪后的输入2)利用所有加噪后的样本对当前的降噪收缩自编码器进行训练,按照下式计算第i个降噪收缩自编码器中的输出权重矩阵βi,i=1,2,…,m:其中I为单位矩阵,C和λ为正则化参数,H为隐藏层输出矩阵,为隐藏层输出矩阵H对输入样本x的偏导,HT为矩阵H的转置;步骤5:计算模型第一部分的输出fSELM‑DCAE(x):fSELM‑DCAE(x)=βm(g(βm‑1(...g(β0x))) (3)步骤6:利用第一部分的输出fSELM‑DCAE(x)作为第二部分加权极限学习机的输入,计算加权极限学习机的输出权重矩阵β,计算如下:其中T为插值位置处的实际观测值,W为权重矩阵,根据样本采集时间所处的季度在总的样本集中所占的比例确定;步骤7:将相关站点的实时水质数据输入到训练好的模型中对虚拟监测位置的水质进行预测,对给定的输入x,预测结果Y可表示为:Y=g(fSELM‑DCAE(x))*β (5)。 |