摘要: |
多年来,道路上的车辆数量大幅增加,特别是在人口密集的地区。这种不正常的增长导致了许多不良的后果,如严重的交通拥堵,过多的二氧化碳排放,出行时间的增加以及人们生活质量的下降。由于运输网络的饱和度和复杂性,必须找到有效的解决方案,使我们能够了解道路交通,并预测交通流的发展变化,以尽量减少其造成的负面影响。通过对道路交通流量的数据分析,有关部门可以指定相应的符合当地路况的政策来提高各个道路的利用率,最终达到解决交通拥堵等问题。最近几年以来,数据挖掘技术在交通流量预测领域发挥着越来越重要的作用。本论文旨在开发一种数据处理方法,通过数据挖掘技术(机器学习)来分析和预测道路流量。为此,对2017年6月10日至17日,英国剑桥自动车牌识别(ANPR)摄像头采集到的所有出行链数据进行了详细的分析。本文首先基于Python编写代码完成数据的初步处理和分析。其次,基于Tableau分析了一周内的交通行为。然后,采用K-Means算法对具有相似特征的元素进行分组,分析交通行为。考虑到在K-Means算法中需要指定群组数量,而这通常被认为是该算法的一个缺陷,本论文利用Elbow方法来确定要形成的群组的适当数量。此外,为了验证K-Means算法创建的群组的合理性,本文应用了Silhouette方法;该方法通过计算Silhouette指数(s(i))以评估群组的分离和压缩程度。最后,使用人工神经网络(ArtificialNeuralNetwork,ANN)算法来预测道路交通流量。选择该算法是因为无论是在处理时间还是在准确性方面,其对短期道路流量预测都能呈现出较好的结果。本论文中使用的神经网络架构是多层感知器(MultilayerPerceptron,MPL)和长短期记忆(LongShort-termMemory,LSTM)类型。另外,对于预测模型结果的评估,本研究利用了平均绝对误差(MeanAbsoluteError,MAE)、平均平方根误差(RootMeanamp;nbsp;SquaredError,RMSE)和平均绝对百分比误差(MeanAbsolutePercentage,MAPE)等指标。本论文使用的评估指标显示,在多层感知器(MPL)和长短时记忆(LSTM)神经网络架构之间,大多数时候,神经网络架构多层感知器(MPL)的预测结果准确性更高。 |