论文题名: | 停车场监控数据预处理和聚类分析 |
关键词: | 正态判断;相似性度量;停车场;监控数据;聚类分析;归一化处理 |
摘要: | 随着汽车保有量的快速增加,对停车场所的需求日益加剧。然而机动车停车场的建设速度却落后于机动车的增长速度,造成停车泊位严重不足,停车供求严重不平衡的矛盾也在日益凸显。停车场大规模建设受到土地和资金等因素的限制,因此,对停车场资源的合理利用、规划、智能停车诱导,并实现城市停车事业的市场化、产业化是解决停车问题的主要途径。 停车事业的市场化和产业化离不开科学技术的指导,而解决一个问题,首先要进行调查,在停车规划前先进行调查和收集停车资料。数据挖掘,能从大量不完整的、有噪声的、模糊的实际应用数据中提取出潜在有用的信息,进而可指导停车场的规划和建设。 本文使用某市大量停车场的进出车辆的采集数据,首先应用数理统计的方法,对数据对象做了预处理;其次研究了停车场的进出车流量的采样时间序列的相似性;最后对停车场网络的进出车流量的采样时间序列进行了归一化处理,采用改进的基于停车场相似度的k-means聚类算法和基于欧氏距离的经典k-means算法进行聚类,并结合停车场的地理分布对结果比较和分析,得到停车场的分类结果。 本文的主要工作如下: 1、根据数据字段类型在数据库中建表空间和表,将原始数据导入数据库的表中,并进行预处理,包括从定性和定量角度进行正态性分析,使用改进的分位数法判断错误数据,并对空缺数据进行填补等。 2、将单停车场的进出车流量采样后用时间序列的方式表示,通过定义一种新的相似性度量函数,验证了单停车场在不同天的时间序列之间的相似性。 3、对停车场网络在一个周期内的采样时间序列,首先进行了归一化,然后使用改进的基于停车场相似度的k-means算法和基于欧氏距离的k-means算法,对处理后的目标数据集进行聚类,得到停车场的分类结果,结合停车场的地理分布,验证了该聚类方法用于停车场的分类是有效的。 |
作者: | 高梦婷 |
专业: | 智能交通工程 |
导师: | 侯忠生 |
授予学位: | 硕士 |
授予学位单位: | 北京交通大学 |
学位年度: | 2011 |
正文语种: | 中文 |