主权项: |
1.一种目标驾驶员驾驶行为实时预测系统,其特征在于,该系统包括信息采集仪、CAN总线、车载导航、感知传感器、存储器和处理器; 所述信息采集仪,用于采集获得目标驾驶员的操作信息,并由CAN总线传送至存储器; 所述车载导航及感知传感器,布设在车辆上,用于采集本车的状态信息以及周围环境信息,并送至存储器; 所述存储器,还存储有源驾驶员驾驶行为历史信息; 所述处理器,用于调用源驾驶员驾驶行为历史信息,并将其迁移至目标驾驶员处,得到迁移学习的数据,以训练得到目标驾驶员驾驶行为模型;并基于实时采集的目标驾驶员的操作信息、车载导航和感知传感器采集到的本车状态信息和周围环境信息,利用训练得到的所述目标驾驶员驾驶行为模型预测目标驾驶员下一时刻的驾驶行为。 2.根据权利要求1所述的系统,其特征在于,所述目标驾驶员的操作信息包括本车方向盘转角、方向盘角加速度、方向盘静止时间、制动踏板位置、加速踏板位置、离合器踏板位置和变速器档位;所述信息采集仪包括方向盘测量器、踏板测定器和档位记录器;所述方向盘测量器用于采集方向盘转角、方向盘角加速度和方向盘静止时间,所述踏板测定器用于采集制动踏板位置、加速踏板位置和离合器踏板位置,所述档位记录器用于采集变速器档位; 所述感知传感器包括至少以下一种或者多种传感器的组合:加速度传感器、陀螺仪、速度传感器、红外传感器、激光测距传感器、毫米波测距传感器、超声波传感器、摄像头。 3.根据权利要求1所述的系统,其特征在于,所述处理器包括驾驶行为信息采集模块、驾驶行为数据迁移模块、驾驶行为模型训练模块和驾驶行为实时预测模块; 驾驶行为信息采集模块,用于接收采集的目标驾驶员的操作信息、本车状态信息和周围环境信息,以及调用源驾驶员驾驶行为历史信息; 驾驶行为数据迁移模块,用于通过基于局部普氏分析的迁移学习算法,将源驾驶员驾驶行为历史信息数据迁移至目标驾驶员处,得到迁移学习的数据以实现目标驾驶员驾驶行为模型自适应; 驾驶行为模型训练模块,用于根据迁移学习的数据并基于主成分分析和最大期望算法训练目标驾驶员驾驶行为模型; 驾驶行为实时预测模块,用于根据训练得到的目标驾驶员驾驶行为模型,结合信息采集仪实时采集的目标驾驶员的操作信息、车载导航和感知传感器采集到的本车状态信息和周围环境信息,对下一时刻目标驾驶员驾驶行为进行实时预测。 4.根据权利要求3所述的系统,其特征在于,源驾驶员驾驶行为历史信息包括其他驾驶员的操作信息、其他驾驶员操作时本车的状态信息和周围环境信息; 所述驾驶行为数据迁移模块中迁移学习的计算过程具体包括:找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点;计算其他驾驶员驾驶行为数据到目标驾驶员驾驶行为数据的映射关系;根据所述映射关系将所有的其他驾驶员驾驶行为数据映射到目标驾驶员处; 所述找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点具体包括:从目标驾驶员处采集的数据中均匀采样得到目标驾驶员驾驶行为数据样本;根据动态时间规整算法对目标驾驶员驾驶行为数据样本与所有的其他驾驶员驾驶行为数据进行一一计算,得到与目标驾驶员数据样本点对应的其他驾驶员驾驶行为数据样本点。 5.根据权利要求4所述的系统,其特征在于,基于所述动态时间规整算法获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点,具体包括:将驾驶员的操作信息、本车状态信息和周围环境信息组成矢量z,目标驾驶员驾驶在时刻j的数据为其他驾驶员作为迁移的数据源在时刻i的数据为若与构成对应点,则将其索引组成一个索引对wl=(i,j); 求解所有对应点之间的最小距离得到一个最优的索引对序列通过所述最优的索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点,获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点。 6.根据权利要求5所述的方法,其特征在于,所述对应点满足以下三个约束条件: 连续条件wl+1-wl∈{(1,0),(0,1),(1,1)}; 边界条件w1=(1,1),wL=(Nso,Nta),其中Nso与Nta分别为源驾驶员数据与目标驾驶员数据数量; 单调性条件wl=(i,j),wl′=(i′,j′),若l′≥l则i′≥i且j′≥j; 所述求解所有对应点之间的最小距离得到一个最优的索引对序列的公式如下: 7.根据权利要求1或5所述的方法,其特征在于,所述驾驶行为数据迁移模块中基于局部普氏分析的不同驾驶员间数据的迁移学习具体包括:通过所述动态时间规整算法获得与目标驾驶员数据样本点对应的源驾驶员数据样本点 基于高斯混合模型对目标驾驶员数据样本点聚类,将目标驾驶员数据样本点分为K部分并通过所述动态时间规整算法获得的样本点对应关系,将源驾驶员数据样本点相应地分为K部分 对于每一部分样本点寻找一个最优映射矩阵使得映射后的源驾驶员数据样本与目标驾驶员数据样本最接近,矩阵公式如下: 其中,与分别为源驾驶员数据样本和目标驾驶员数据样本第k部分的协方差矩阵。 8.根据权利要求1所述的方法,其特征在于,所述驾驶行为模型训练模块建立自适应的目标驾驶员驾驶行为模型过程包括: 通过主成分分析提取当前时刻驾驶员的操作信息、本车状态信息和周围环境信息,得到当前时刻状态信息低维度的特征量s作为模型输入量;将下一时刻的驾驶员操作信息a作为模型输出量;将当前时刻状态量与下一时刻驾驶员操作信息组合为训练数据x=[s,a]T; 训练高斯混合模型通过最大期望算法训练得到模型,公式如下: 其中,K为模型的预设参数;N表示多维高斯分布,共有K个高斯成分;πk,与为训练得到的模型参数,分别表示第k个高斯成分的权重,均值,向量和协方差矩阵。 9.根据权利要求1或8所述的方法,其特征在于,根据所述目标驾驶员驾驶行为模型,结合目标驾驶员驾驶时实时采集的驾驶员操作信息、本车状态信息和周围环境信息,对下一时刻目标驾驶员驾驶行为进行实时预测,具体包括:当目标驾驶员驾驶车辆时,实时采集驾驶员驾驶行为信息,通过所述建模过程中的主成分分析得到的特征提取参数,将实时驾驶员驾驶行为信息提取为与建模过程中相同维度的实时状态信息;通过对当前时刻驾驶员的操作信息、本车状态信息和周围环境信息进行降维和特征提取,当前的实时数据被处理为驾驶员驾驶行为模型的输入量,预测下一时刻目标驾驶员的驾驶行为; 所述主成分分析的提取参数的特征信息具体包括:根据采集的目标驾驶员驾驶行为数据dt(t=1…N)计算协方差矩阵: 其中,N是数据矢量的数量,为均值矢量,由计算得到; 对所述协方差矩阵进行特征值分解的公式如下: Σui=λiui; 其中,ui与λi分别是相对应的第i个特征向量与特征值; 在特征值中选择最大的D个特征值,并降序排列为λ1,λ2,…,λD,其对应的特征向量按同样的顺序组成矩阵U=[u1,u2,…,uD]T; 所提取的特征信息矢量由公式得到。 10.根据权利要求1或8所述的方法,其特征在于,所述驾驶行为实时预测模块通过所述驾驶员驾驶行为模型进行实时预测的过程具体包括:车载设备中信息采集仪实时采集驾驶员操作信息、车载导航和感知传感器采集本车状态信息和周围环境信息z′;将实时采集的信息经过与建模过程中相同的降维过程,处理为当前时刻状态向量s′;将当前时刻状态向量作为模型输入,通过高斯混合回归过程预测得到下一时刻驾驶员驾驶行为量 所述高斯混合回归过程,具体包括:将模型建立过程中训练得到的高斯混合模型参数与按照模型输入s的维度和模型输出a的维度拆分为分块矩阵: 依据当前时刻的状态s′,按照如下公式计算高斯混合模型中每一个高斯成分的预测量加权平均值,预测下一时刻驾驶员驾驶行为量: 其中,表示第k个高斯成分的预测量;表示当前时刻的状态量s′处于第k个高斯成分的概率。 |