当前位置: 首页> 学位论文 >详情
原文传递 融合交通环境信息的混合动力汽车能量管理策略研究
论文题名: 融合交通环境信息的混合动力汽车能量管理策略研究
关键词: 混合动力汽车;单目深度速度估计;强化学习;场景建模
摘要: 随着化石能源的大量消耗和电力需求的急剧增加,环境污染日益严重。为了防止全球环境问题的恶化,所有行业都面临着绿色发展的挑战。全球燃油消耗中,运输行业占比约为31%,其中道路运输占比最大。汽车行业作为消耗能源和排放污染的主要行业之一,已经成为绿色发展的重点领域。通过采用新能源汽车、推广节能减排技术等措施,汽车行业可以减少对环境的负面影响,为实现可持续发展做出贡献。混合动力汽车已被证明是解决环境和能源问题的有效途径,与电动汽车相比,混合动力汽车可以摆脱电池技术的限制,以更低的能耗和排放提高续航能力,实现多种电源的优势互补,提高车辆的整体性能。混合动力汽车同时具备燃油和电动两种动力系统,并通过能量管理策略实现燃油和电动的转换,从而实现更高的燃油效率和更低的排放量。能量管理策略经常会受到行驶工况的影响,同时交通信息的瞬态特性极大地影响了车辆的行驶状况,所以如果可以融入环境信息就可以较大改善混合动力汽车的燃油经济性。融合环境信息的能量管理策略大部分是基于车辆自身,而融合的环境信息经常是从车联网中直接获得的,但是车联网技术还没有大面积的普及。所以本文从车辆自身的传感器入手,从原始的图像数据中提取有用的信息,融合到能量管理策略当中。另外,融入的信息要具有代表性,概括性和典型性,而且不能掺杂其他误差因素的影响。因此更加需要从车辆行驶最典型的数据上入手,在本文中选择前方车辆的深度与相对速度作为环境的典型信息融入到能量管理策略,主要研究内容如下:
  (1)分析了混合动力汽车的基本构型,确立本文的研究对象是混联式混合动力汽车,分析了混合动力汽车的8种工作模式以及对发动机、电机、电池、变速箱等关键部件建模。为了能够在硬件在环测试过程中,视景信息与行驶信息的对应,本文基于Unreal引擎对场景进行建模,实现与世界路网的对应。
  (2)提出一种适用于能量管理策略的单目深度速度估计算法,将深度估计与速度估计两大任务合并在一起,与能量管理策略融合。在该部分中,首先介绍了世界坐标系、相机坐标系以及图像像素坐标系三种坐标系的原理和转换关系,为几何线索提供转换关系基础。考虑到几何线索,深度特征线索,光流特征线索,多维特征需要融合,提出利用注意力机制将这些特征合理的结合使得模型更加注重训练中所关注的特征。
  (3)设计了在强化学习框架下的能量管理策略的奖励函数参数匹配方法。通常研究者构建奖励函数具有主观性和经验性。而且在大部分的研究中,经常会使用手动调参的方法获得相应的超参数,这直接导致了奖励函数的设定会包含过多的人为干扰因素。在本文中提出用标定后的电池和发动机双智能体的权重系数逆向指导智能体的行为,反向得到权重系数。之后将得到的权重放入正向强化学习算法中,结果显示可以获得更好的节油效果。该算法主要包含四个部分:第一部分表示发动机和电池的最佳状态,对于发动机而言是最佳工作点,对于电池而言是保持电池SOC值合理稳定,即电池内阻较低和稳定的电动势;第二部分是逆向强化学习的算法框架,定义最大熵逆向强化学习;第三部分表示强化学习环境,将逆向获得的参数输入到环境中;第四部分是强化学习的DQN算法,目的是用正向强化学习验证算法。
  (4)提出将单目深度速度估计算法与强化学习基本算法融合的方法,其中采用了逆向强化学习训练的超参数。依据强化学习的基本理论,构建基于强化学习的混合动力汽车能量管理任务,然后利用单目深度速度估计结果,输入到构建的RBF转矩预测网络中,预测出下一时刻的需求转矩。最终将预测出的转矩和深度速度数据以状态值的形式输入到强化学习网络中,得到带有需求转矩的强化学习基本模型。
  (5)针对本文融合环境信息的能量管理策略展开硬件在环研究。首先依据实验室条件,搭建了硬件在环实验台,实验系统由混合动力模型、驾驶员操作系统、虚拟场景系统、传感器系统、NI实时系统和车辆控制单元组成。
  由仿真实验与硬件在环实验结果可知,本文所提出的算法均具有良好的准确性与节油性。本文的研究对于推动融合交通环境信息的能量管理策略,逆向强化学习的能量管理策略奖励函数的参数设定,从多线索融合出发的单目深度速度估计具有积极意义,有助于进一步提升混合动力汽车的节油性能。
作者: 齐春阳
专业: 车辆工程
导师: 宋传学
授予学位: 博士
授予学位单位: 吉林大学
学位年度: 2023
检索历史
应用推荐