论文题名: | 基于深度学习和手机信令大数据挖掘的居民出行行为特征识别 |
关键词: | 手机信令数据;数据挖掘;深度学习;聚类分析;自编码神经网络 |
摘要: | 居民的出行活动与出行行为是城市活动-移动系统中重要的组成部分。研究表明,居民的出行活动并非是完全随机、无规律可循的。相反,居民的活动往往与城市的社会经济发展、空间分布特征表现出高度的关联性。因此,对居民的出行活动研究,把握居民出行行为特征和规律性对于城市的交通规划、交通管理以及交通政策的制定具有重要的参考意义。 在数据源获取上,传统出行行为研究依赖于居民问卷调查数据,存在耗费时间较长、成本较高、数据样本量小且回收率和有效率低等缺点。在研究方法上,传统出行行为多采用单一的基于时间维度的序列分析或基于距离维度的空间分析,但居民的出行是包含多维特征的数据,传统的方法无法满足对多维信息综合分析的要求。手机信令数据作为新型交通大数据的一种,具有样本量大、覆盖范围广以及精确度高等特点,同时还具有动态实时性和连续性,可以更好的反映居民出行行为的时空规律。此外,基于深度学习的方法,能够将居民的出行行为特征在最大程度进行降维压缩,以最小损耗保留最大特征,有助于高效精准挖掘出行规律。 基于此,本文以居民手机信令数据为数据源,以大连市为研究区域,采用深度学习融合聚类分析的方法对大连市居民的出行行为特征进行研究。(1)论文首先将手机信令数据与基站位置数据表通过表之间的映射进行融合,以用户id为聚合进行用户划分,创建每个用户的出行轨迹数据集。(2)其次针对手机信令数据中的无效数据、同时间不同位置数据、乒乓切换数据以及漂移数据进行预处理,制定判别流程、识别规则以及处理方法。(3)然后针对出行轨迹数据集进行出行特征信息提取,将用户的三维出行轨迹逐步转为出行特征图像。进而搭建自编码神经网络模型,将所有出行特征图像进行降维压缩得到出行特征向量,此特征向量即可在最大程度上表示居民的出行特征。(4)通过构建聚类算法,对特征向量进行聚类分析,即将具有相似出行行为特征人群进行归类,共得到八种不同类别。(5)根据聚类结果通过回溯数据,将用户出行特征图像进行叠加,进而抽象得到该类别人群的出行共性特征,纵向对比可得到不同类别间的出行特征差异。根据实际分析将八类居民特征图像叠加后的结果进行归纳总结,进而得到契合大连市的出行行为特征。通过归纳总结,本文将大连市的出行行为特征分为五类,并针对五类出行行为特征进行详细分析。(6)对大连市居民出行时间分布特征分析,针对典型类别居民的出行空间分布特征、职住关系特征进行分析,同时选取平均通勤距离,幸福通勤(5公里通勤比重)指标对典型类别居民的通勤特征进行分析。 在本研究中,将大连市居民出行行为共分为五大类,分别为常规出行通勤类(固定居所)类、常规出行非活跃出行类、非常规出行通勤类(不固定居所)、非常规出行离连类以及非常规出行服务类。研究数据表明大连市一天内常规出行人数占比70.39%,非常规出行人数占比为29.61%,通勤总人数占比为41.94%。在居民出行时间分布特征上,研究研究表明大连市居民在工作日的出行共有两个较大的峰值,分别为早晚高峰,早高峰时间段为7:00-8:00,晚高峰时间段为17:00-19:00,晚高峰的峰值高于早高峰,出行量大于早高峰。此外,10:00-11:00有较小的峰值,这类居民的通勤晚于早高峰,根据大连市实际情况分析推断该类居民为弹性上班时间,如互联网行业从业者或自由从业者。在出行空间分布特征上,研究结果表明常规出行通勤类(固定居所)居民的就业区和居住区分布较为明显,且距离相对较近,职住分离度较小,就业区集中在中山区和西岗区以及高新区的凌水街道附近,居住区集中在甘井子区的红旗街道、李家街道、椒金山街道。在出行通勤特征上,研究结果表明常规出行通勤类(固定居所)居民的平均通行距离为5.2771km,通行距离的中位数为2.9856km,第一四分位数为0.8936km,第三四分位数为6.71745km,50%的该类居民通勤距离集中在0.8936km~6.71745km之间。从幸福通勤指标来看,该类居民中有64.95%的居民可达到幸福通勤,其中通勤距离2.5km以内的比重为43.05%,通勤距离在2.5km-5km的比重为21.9%,表明这64.95%的居民有更加合理可控的通勤时间和多样的通勤方式选择,能够达到就近职住,具有较好的通勤体验。 综上,本文基于手机信令数据,采用深度学习融合聚类分析的方法针对大连市居民出行行为特征进行分析,研究结果可服务于大连市差异化的交通政策制定以及精细化的交通管理。 |
作者: | 赵亚宁 |
专业: | 交通运输工程 |
导师: | 王宗尧 |
授予学位: | 硕士 |
授予学位单位: | 大连海事大学 |
学位年度: | 2022 |