专利名称: |
一种辨别出租车是否交予他人驾驶的方法及系统 |
摘要: |
本发明涉及一种辨别出租车是否交予他人驾驶的方法及系统,所述系统包括:包括:数据获取模块、特征构建模块和分类器特征分类模块。所述方法包括:清洗所获取的出租车GPS数据以及计价器数据获得建模数据,根据获取的建模数据对出租车驾驶员个体特征进行建模,将所述出租车个体行为特征通过自相似计算方法映射到统一的特征空间并取值得到特征向量,根据判定模型对所述自相似特征向量做出判定得到判定值,根据预设阀值与所述判定值对比结果得到所述该出租车是否交予他人驾驶的结论。本发明辨别出租车是否交予他人驾驶的方法及模型通过结合大数据挖掘、计算机技术实现对交予他人驾驶的出租车自动准确识别,不仅减轻执法人员的工作负担更提高了工作效率。 |
专利类型: |
发明专利 |
国家地区组织代码: |
北京;11 |
申请人: |
北京市交通信息中心 |
发明人: |
杨雪;汪祖云;赵翰毅;于海涛;刘文平;庞俊彪;岳宇;肖冉东 |
专利状态: |
有效 |
申请日期: |
2019-01-29T00:00:00+0800 |
发布日期: |
2019-06-07T00:00:00+0800 |
申请号: |
CN201910085406.7 |
公开号: |
CN109849926A |
代理机构: |
北京科迪生专利代理有限责任公司 |
代理人: |
安丽;成金玉 |
分类号: |
B60W40/08(2012.01);B;B60;B60W;B60W40 |
申请人地址: |
100161 北京市丰台区六里桥南里甲9号 |
主权项: |
1.一种辨别出租车是否交予他人驾驶的方法,其特征在于: 步骤1:清洗所获取的出租车GPS数据以及计价器数据获得建模数据;所述获取出租车GPS数据包括获取每辆出租车即时经纬度、当前时间以及当前车速;所述获取出租车计价器数据包括:获取每辆车每单起始时间、结束时间、每单收入、出租车当前服务状态,即载客、空车以及每单行驶距离;所述建模数据分为两类:第一类是出租车驾驶员睡觉时长以及经纬度,将第一类建模数据记为STL;第二类是载客每单起始时间以及经纬度,将第二类数据记为PU;根据所述出租车即时经纬度以及当前时间获得所述每辆出租车的轨迹信息,通过匹配所述每单起始时间、结束时间与所述出租车当前时间、当前时间对应的即时经纬度,得到每辆出租车每单出发时间、出发经纬度,每单结束时间、结束经纬度; 步骤2:根据所述建模数据建模出租车驾驶员个体行为模式;所述出租车驾驶员个体行为模型分为两类:第一类是居住地模型,即STL模型;第二类是载客行为模型,即PU模型; 步骤3:将出租车驾驶员个体行为模式映射到自相似特征空间,得到自相似特征向量; 步骤4:得到自相似特征向量后,有两种方法建立判别模型,一种是利用的士之星作为负样本,抓获的交予他人驾驶的出租车作为正样本,建立两类分类模型;一种是利用oneclass分类器(本发明实施例使用One Class SVM)进行直接建立判定模型;根据判定模型对所述自相似特征向量做出判定得到判定值;根据预设阀值与所述判定值对比结果得到所述该出租车是否交予他人驾驶。 2.根据权利要求1所述的方法,其特征在于:步骤1中,所述清洗出租车GPS数据为:在出租车路过交叉路口、立交桥和高大建筑物时GPS数据会不准确,出租车GPS信号会受到阻隔造成信号缺失,对所述GPS数据进行清洗,取设定的地区内的GPS数值。 3.根据权利要求1所述的方法,其特征在于:步骤1中,对于所述第一类建模数据为:如果出租车司机处于睡觉状态,则该司机相对应的出租车位置在此时间段内不会发生改变且出租车状态处于空车状态,把最大时间间隔时间定义为出租车驾驶员的睡觉时间,所述出租车位置为睡觉时间的经纬度,将此建模数据作为STL; STL的数据向量,即ts为出租车出发时间,为居住地位置,td为睡觉持续时长。 4.根据权利要求1所述的方法,其特征在于:步骤1中,第二类建模数据为:经过半个月以上的数据积累,PU能够可靠地反映出租车驾驶员的偏好,所述出租车驾驶员的偏好为在某时间段出租车驾驶员更偏向于去某地区载客;经过分析统计,不同的出租车驾驶员的偏好是不同的,从这个角度出发,通过检验PU是否改变作为检验出租车是否交予他人驾驶的依据; 所述PU的数据向量,即tpu是指每单起始时间,是乘客上车地点经纬度。 5.根据权利要求1所述的方法,其特征在于:步骤2中,所述STL模型是通过FisherVector对STL进行建模,所述PU模型是通过LDA概率模型对PU进行建模。 6.根据权利要求5所述的方法,其特征在于:所述Fisher Vector结合生成式模型和判别式模型得到,生成式模型直接对数据进行建模;判别式模型为对未知数据与已知数据之间的关系进行建模; 所述Fisher Vector具体实现为:用似然函数对混合高斯核中的均值与标准差参数求偏导数对参数进行优化使数据拟合结果更能反映出租车驾驶员个体居住地行为模式特征。 7.根据权利要求5所述的方法,其特征在于:所述LDA一种概率模型,所述LDA认为文档由多个词构成,且每个文档对应一个主题,所述主题由所述词反映; 所述通过LDA概率模型对PU进行建模实现为:首先通过K-means聚类对PU按照预先设定的聚类数目进行聚类,聚类得到结果被视为不同的“单词”,一定时间段的“单词”组成“文档”; 对文本语料库与出租车的PU作如下类比:聚类后的PU被看作“单词”,相应的,在同一个时间段的所有“单词”被看作为一个“文档”,“文档”中潜在的“主题”即为出租车驾驶员的载客行为,当“单词”发生改变时,“单词”对应的“主题”概率值就会发生改变,即出租车驾驶员的载客行为就会发生改变。 8.根据权利要求1所述的方法,其特征在于:步骤3中,将出租车驾驶员个体行为模式映射到自相似特征空间,得到自相似特征向量是通过自相似的方法将所述STL模型描述的出租车驾驶员居住地行为特征以及PU模型描述的出租车驾驶员载客行为特征结合起来用以描述出租车驾驶员的驾驶特征,具体实现为: 在给定所述STL模型描述的居住地行为模型特征以及PU模型描述载客行为模型特征后,计算在某一预先设定时间段内连续两天特征相似度,所述相似度具体是指:所述Similarity(,)是任意比较特征之间相似程度的方法,所述方法包括计算特征向量之间的cosine距离、计算特征直方图的重叠部分,本发明实施例中使用的是cosine距离计算特征向量之间的相似程度;在中,参数c是指第c辆出租车、参数bi是指第b个预先设定的时间段中的第i天,所述预先设定的时间段包括:以16天为一个时间段、以16天前8天为一个时间段、以16天后8天为一个时间段、以所述前8天的前4天为一个时间段、以前8天的后4天为一个时间段、以所述后8天的前四天为一个时间段、以后8天的后4天为一个时间段,时间段共有七个,每辆车在每个所述时间段内得到个自相似结果,其中days为时间段内的天数,选取中最大最小的两个计算结果,按照16天最大最小值、8天最大最小值、8天最大最小值、、、第二个8天的前4天的最大最小值、第二个8天的后4天的最大最小值进行排序,得到出租车驾驶员的行为特征。 9.根据权利要求1所述的方法,其特征在于:步骤4中,根据所述获得的出租车的特征向量,利用监督学习的方法对出租车驾驶员进行行为特征分类得到概率值,对比概率值与预先设定的阀值,如果概率值大于预先设定的阀值就判定该出租车驾驶员换过人,即发生出租车交予他人驾驶的行为。 10.一种辨别出租车是否交予他人驾驶的系统,其特征在于,包括:数据获取模块、特征构建模块和分类器特征分类模块; 数据获取模块:用于获取GPS数据以及计价器数据并清洗GPS数据,组织构建特征需要的建模数据; 特征构建模块:根据所述建模数据按照Fisher Vector以及LDA分别构建居住地模型以及载客模型,按照自相似计算得到出租车驾驶员的综合行为特征; 分类器特征分类模块:输入是出租车对应驾驶员的综合行为特征,输出是该出租车交予他人驾驶的概率值,将此概率值与预设阀值作比较,如果概率值大于此阀值则判定该出租车发生交予他人驾驶的行为,否则判定该出租车没有发生交予他人驾驶行为。 |
所属类别: |
发明专利 |