主权项: |
1.一种基于无人机成像技术的道路目标检测方法,其特征在于,包括以下步骤: S1、选择可见度较好,晴朗的天气开展图像采集工作,避免在采集的训练集图像不够清晰造成的训练误差;通过人为操控无人机成像系统中搭载高清相机的多旋翼无人机对日常道路进行图像采集,得到道路日常图像,同时将采集到的清晰的道路日常图像传回地面站; S2、对无人机传回的道路日常图像进行预处理,采用k-means聚类算法实现自动选取最佳先验框,避免了由于部分遮挡等情况造成的人为误判而导致的误差,根据包含n个数据对象的数据集随机选取k个数据对象作为聚类算法的初始类簇中心点,根据相似性度量标准划分数据集中的数据对象,通过反复迭代直至所属聚类簇不再发生变化,从而可以确定最佳先验框; k-means聚类算法的输入为包含N个数据对象的数据集D={x1,x2,…,xn},输出为k个彼此独立的类簇C={C1,C2,…,Cn},具体步骤如下: step1、从输入数据集D中随机选取出k个数据对象,作为初始的聚类簇中心点; step2、计算数据集D中数据对象与k个粗类中心点之间的相似度,将聚类对象分配到最相似的类簇中心点代表的类簇中; step3、统计每个类簇中数据对象信息,取其均值作为新的类簇中心点,更新类簇中心点信息; step4、迭代执行上述的step2和step3直至算法执行完毕,类簇中心点不再发生变化; 其中,对于包含m个属性的两个数据对象x={x1,x2,…,xm}和y={y1,y2,…,ym},相似度的计算采用Pearson相关系数如下所示: S3、确定好训练数据集中的每张图片的每个类别的先验框后,建立yolov4深度学习模型,将所有道路日常图像及其先验框对应的坐标点输入到建立好的yolov4深度学习模型中,调节batch大小和学习率等超参数,选择适当的损失函数,开始参数训练; 首先对输入到Yolov4深度学习模型中的道路日常图像进行大小调整,将所有的图像全都调整到416*416大小,然后进行数据增强,数据增强主要分为几种形式,分别为图像翻转、图像旋转90度以及图像色域变换;图像增强的主要目的是在深度学习的过程中实现图像数据集扩增,增加模型的泛化能力; 在进行图像增强后,设置超参数;深度学习模型调用CSPdarknet53结构模块,主要由一个大的残差边和小的残差模块组成,CSPdarknet53主体输入为一张416*416*3的图像,输出为三个有效特征层;在进行前向传播训练前,划分训练集和验证集的比例为1:9,设置初始学习率为1.76e-6,batch大小为4,总训练世代epoch为300,开始进行前向传播网络训练; 前向传播训练的过程基本为:首先确定图片数量,计算特征层的宽和高,获得置信度和种类置信度,计算输出结果和真实结果的回归损失,选择CIOU损失函数,表达式为: 上述公式中,wgt表示真实框的宽,hgt表示真实框的高,w表示预测框的宽,h表示预测框的高,bgt表示真实框的中心点坐标,b表示预测框的中心点坐标,c为预测框和真实框的最小包围框的对角线长度; 置信度损失函数使用BCE损失,即二分类交叉熵损失函数,其表达式为 loss(Xi,yi)=-wi[yilogxi+(1-yi)log(1-xi)] 上述式子中,xi为输入,yi为输出,wi为输权重系数; 随后根据损失进行反向传播更新,更新权重和偏置;反复重复此过程,直至迭代完成所有的epoch且达到要求的训练精度; 其中,学习率更新采用余弦退火学习率,其原理如下: 上式中,i代表第几次的索引值,和代表学习率的最小值和最大值,Tcur表示当前之心好了多少个epoch,Ti表示总的epoch数; S4、yolov4深度学习模型训练好后,调用该模型进行预测;通过步骤S1采集新的道路日常图像,输入到训练好的yolov4深度学习模型中,验证模型的准确性; S5、若模型的准确率达到要求,则保存参数权重,输出训练好的模型,通过该模型和权重实现道路目标检测;若准确率未达到要求,则回到步骤S3重新调整参数,选取损失函数,继续训练,直至准确率达到要求,输出模型。 |