论文题名: | 基于Logistic回归的高速公路绿通车稽查研究 |
关键词: | Logistic回归;高速公路;绿通车稽查;数据挖掘 |
摘要: | 由于高速公路绿通车管理不完善以及经济利益诱惑,导致绿通车偷逃费情况频繁发生,而目前的绿通车稽查方式存在稽查效率低、工作流程繁琐等问题,如何解决这些问题已经成为高速公路管理部门的重要课题。论文通过对高速公路绿通车偷逃费行为和偷逃费情况进行分析,提出了基于Logistic回归模型的高速公路绿通车稽查模型。 论文首先对高速公路绿通车偷逃费行为和情况进行分析,研究各类偷逃费行为的原因和数据特征,并详细分析假冒绿通车与合格绿通车在免费金额、车辆吨位等类型区间的不同分布特征,提出了绿通车稽查模型的设计原则和目标。基于Logistic回归模型,对高速公路绿通车稽查模型进行设计,并对绿通车稽查模型工作流程进行了详细分析。 其次,根据绿通车稽查数据集特点和稽查业务需求,建立绿通车稽查数据集预处理方法,并对各阶段处理结果进行效果对比,确定SMOTE算法作为绿通车稽查数据集的过抽样处理方法,选择ChiMerge算法对绿通车稽查数据属性进行离散化,利用Min-Max算法对绿通车稽查数据进行规范化处理,使绿通车数据集适用于Logistic回归分析。 然后,利用K-S算法检验绿通车稽查数据连续值属性的正态性,对符合正态分布的连续值属性进行独立t检验,对不符合正态分布的连续值属性进行曼恩-惠特尼U检验,对离散值属性进行卡方检验,分析各属性与绿通车检查结果的关联性。利用容忍度、方差膨胀因子等对属性间共线性情况进行综合判断,对存在验证共线性关系的属性进行筛选。根据关联性检验和共线性诊断结果,建立Logistic回归模型的绿通车稽查模型,并对系数计算过程及模型结果的解释方法进行分析。 最后,选择运输家畜肉和运输家禽肉的绿通车数据进行实例分析,对绿通车稽查数据属性货车吨位、行驶距离进行离散化,结合关联性检验结果和共线性诊断结果,建立相应的绿通车稽查模型,利用训练数据进行模型训练,生成相应的回归方程。利用测试数据对稽查模型进行测试,运输家畜肉绿通车的测试效果为:灵敏度为85.51%、特异度为87.91%,运输家禽肉绿通车的测试效果为灵敏度为84.24%、特异度为55.77%。结果表明稽查模型具有一定的有效性,运输家禽肉绿通车稽查模型存在过拟合问题。 |
作者: | 陈浩泰 |
专业: | 交通信息工程及控制 |
导师: | 靳引利 |
授予学位: | 硕士 |
授予学位单位: | 长安大学 |
学位年度: | 2017 |
正文语种: | 中文 |