当前位置: 首页> 学位论文 >详情
原文传递 基于Logistic回归的高速公路绿通车稽查研究
论文题名: 基于Logistic回归的高速公路绿通车稽查研究
关键词: Logistic回归;高速公路;绿通车稽查;数据挖掘
摘要: 由于高速公路绿通车管理不完善以及经济利益诱惑,导致绿通车偷逃费情况频繁发生,而目前的绿通车稽查方式存在稽查效率低、工作流程繁琐等问题,如何解决这些问题已经成为高速公路管理部门的重要课题。论文通过对高速公路绿通车偷逃费行为和偷逃费情况进行分析,提出了基于Logistic回归模型的高速公路绿通车稽查模型。
  论文首先对高速公路绿通车偷逃费行为和情况进行分析,研究各类偷逃费行为的原因和数据特征,并详细分析假冒绿通车与合格绿通车在免费金额、车辆吨位等类型区间的不同分布特征,提出了绿通车稽查模型的设计原则和目标。基于Logistic回归模型,对高速公路绿通车稽查模型进行设计,并对绿通车稽查模型工作流程进行了详细分析。
  其次,根据绿通车稽查数据集特点和稽查业务需求,建立绿通车稽查数据集预处理方法,并对各阶段处理结果进行效果对比,确定SMOTE算法作为绿通车稽查数据集的过抽样处理方法,选择ChiMerge算法对绿通车稽查数据属性进行离散化,利用Min-Max算法对绿通车稽查数据进行规范化处理,使绿通车数据集适用于Logistic回归分析。
  然后,利用K-S算法检验绿通车稽查数据连续值属性的正态性,对符合正态分布的连续值属性进行独立t检验,对不符合正态分布的连续值属性进行曼恩-惠特尼U检验,对离散值属性进行卡方检验,分析各属性与绿通车检查结果的关联性。利用容忍度、方差膨胀因子等对属性间共线性情况进行综合判断,对存在验证共线性关系的属性进行筛选。根据关联性检验和共线性诊断结果,建立Logistic回归模型的绿通车稽查模型,并对系数计算过程及模型结果的解释方法进行分析。
  最后,选择运输家畜肉和运输家禽肉的绿通车数据进行实例分析,对绿通车稽查数据属性货车吨位、行驶距离进行离散化,结合关联性检验结果和共线性诊断结果,建立相应的绿通车稽查模型,利用训练数据进行模型训练,生成相应的回归方程。利用测试数据对稽查模型进行测试,运输家畜肉绿通车的测试效果为:灵敏度为85.51%、特异度为87.91%,运输家禽肉绿通车的测试效果为灵敏度为84.24%、特异度为55.77%。结果表明稽查模型具有一定的有效性,运输家禽肉绿通车稽查模型存在过拟合问题。
作者: 陈浩泰
专业: 交通信息工程及控制
导师: 靳引利
授予学位: 硕士
授予学位单位: 长安大学
学位年度: 2017
正文语种: 中文
检索历史
应用推荐