当前位置: 首页> 学位论文 >详情
原文传递 基于强化学习的车载网络移动停车激励的研究
论文题名: 基于强化学习的车载网络移动停车激励的研究
关键词: 车载自组织网络;车辆停车;激励机制;强化学习;深度Q网络
摘要: 伴随着无线设备的快速发展,现如今越来越多的车辆都配备有大量的无线设备,使利用大规模的车载网络成为了可能,因此,工业界和学术界对车载自组织网络(VANETs)产生了极大地兴趣。
  车载网络通常会因为车辆的行驶速度快,网络节点间的拓扑结构变化频繁,以及车载无线设备带宽低等问题,导致网络质量不佳。本文采取的解决方案是,利用路侧停放的车辆,将路侧停车加入车辆网络,利用停放的车辆中的无线设备进行网络的数据分发,提高移动车辆间的网络通信质量。虽然路侧停放的车辆具有基数大,分布广泛,停靠时间长的特点,特定位置的停车能形成稳定的集群,但是将停车加入车辆网络,需要车主共享他们车辆上的无线设备,而据调查发现,低于30%的车主愿意共享车辆中的无线设备,并且许多驾驶员比起路侧停车位更加倾向于在停车场停车,而这些停车场往往不能增加车载网络的连通性。解决这些问题的方法通常是设计一种激励机制,鼓励用户将车辆停靠在特定位置。
  在本文中,提出了一个定价系统,为了解决传统的激励方法的不足,考虑设计一种基于强化学习的动态定价算法,使所有路段的连通性达到最大并且最小化系统的成本。将强化学习应用到动态定价的决策问题主要有两个优势:
  (1)强化学习是不依赖模型的,它可以通过代理和环境之间的动态交互来学习最优的动态定价策略。
  (2)强化学习有很强的适应能力,由于道路交通环境的快速变化,导致整体环境具有不确定性的特点,强化学习可以不断朝着最优的奖励的方向进行学习,以适应不断更新的环境。
  由于强化学习在状态空间过大的情况下,具有较慢的学习速度,因此,在本文采用深度Q网络开发定价策略,通过神经网络压缩所学习的状态空间,并据此计算对应的Q值。基于真实的街道布局和对应的路侧停车位数据,使用VanetMobiSim进行车辆轨迹仿真,并将轨迹文件导入NS-2进行网络仿真,最终得出的结果表明,该方案提高了任务的完成率,并且停车结果有效地提高了车辆间通信质量。
作者: 梁榆法
专业: 计算机科学与技术
导师: 刘念伯
授予学位: 硕士
授予学位单位: 电子科技大学
学位年度: 2021
检索历史
应用推荐