论文题名: | 出租车乘客和司机的行为模式研究 |
关键词: | 出租车乘客;出行数据挖掘;行为模式;搜寻策略;对数正态分布;随机森林模型 |
摘要: | 随着科技的进步与社会经济的发展,一方面城市现代化进程加快,另一方面城市的交通拥堵现象也越来越普遍,国内出现越来越多的“堵城”。作为城市交通的重要组成部分,通过对市区内交通参与者的群体行为模式的研究,在深入理解人类出行行为以及缓解城市交通拥堵等方面具有重大意义。 在研究人类的运动和活动时,装备有GPS定位器的车辆是很重要的传感设备。而作为城市交通的一大主体,配备了GPS设备的出租车满足了人们大量的交通出行需求。与此同时,由GPS产生的出租车轨迹数据本身也蕴含了大量的规律,引起了国内外很多学者的广泛关注与深入研究。基于对出租车轨迹数据的分析与挖掘,本文从两个方面对市区内的出租车出行行为加以研究:出租车乘客在市区内的出行模式的挖掘和出租车司机空载时在特定时空条件下采取的乘客搜寻策略效果的预测。 (1)通过对出租车乘客出行数据的挖掘,分析反映出租车乘客群体出行模式的三个统计维度:直接反映乘客出行规律的出行距离、出行时间以及间接反映乘客交通需求的空载时间。本文通过与国内外相关学者在以出租车为载体的群体行为模式挖掘的对比,以及对国内外三个城市共计五个出租车数据集进行统计分析,发现市区内出租车乘客的出行距离服从对数正态分布,并呈现出幂律尾部特征;而不是之前研究得出的指数分布,也不是幂律分布。换言之,对于市区内出租车乘客的短距离出行,出行距离服从对数正态分布;对于长距离的出行,则服从幂律分布。此外,对于出行时间和空载时间,本文发现了同样的规律,均服从包含幂率尾部的对数正态分布。 (2)通过对出租车空载运行数据的挖掘,对出租车司机选取的乘客搜寻策略的效果进行预测。首先,本文基于网格划分的方法识别出载客的热门区域;其次,将热门区域与时间维度结合,进行区域的功能识别;最后,本文对出租车司机选取的乘客搜寻策略的效果进行预测,将描述出租车司机的乘客搜寻策略的数据转换为时间-区域-速度-行为的特征四元组。在此基础上提出一种基于随机森林的分类器模型来预测司机的乘客搜寻策略的效果,发现本文建立的分类器可以在新的数据集上实现95.01%的预测准确率。这说明本文所提出的预测模型能很好地识别出租车司机的乘客搜寻策略效果的优劣,所选取的特征能作为指示器指导司机的乘客搜寻行为。 |
作者: | 张凌 |
专业: | 管理科学与工程 |
导师: | 夏昊翔 |
授予学位: | 硕士 |
授予学位单位: | 大连理工大学 |
学位年度: | 2017 |
正文语种: | 中文 |