论文题名: | 蒙特卡洛树搜索网络在无人车自动驾驶中的研究与应用 |
关键词: | 无人车;自动驾驶;蒙特卡洛树搜索网络;卷积神经网络;微缩智能车 |
摘要: | 自动驾驶问题是一个复杂行为的序贯决策问题,无人车的感知,决策,控制都能影响在交通道路中的轨迹以及自动驾驶的表现。在自动驾驶发展的早期,通常将自动驾驶问题分解成多个子问题,利用分而治之的思想,在每个子问题中分别求解最优。近年来,AlphaGo在围棋领域中战胜人类职业玩家可以证明,蒙特卡洛树搜索网络在序贯问题中可以求解出局部最优,甚至全局最优。本文对自动驾驶问题进行建模,从而利用蒙特卡洛树搜索以及卷积神经网络,对自动驾驶问题模型进行求解。 本文设计并实现了一个端到端的训练以及决策的蒙特卡洛树搜索网络算法,通过车载摄像头捕获试试数据,输出方向盘的转角,实现车辆的自动驾驶。该算法主要分为三个部分,蒙特卡洛树搜索,策略网络以及评估网络,并以蒙特卡洛树搜索为基础,将蒙特卡洛树搜索的选择,扩展,模拟以及更新中的部分过程进行网络化,以此减少搜索树的广度和深度,提高搜索效率,极大地提升了该算法在无人车自动驾驶中决策的智能化水平。同时,针对无人车搭载的计算单元,设计了一个仅由7层卷积和4层全连接的卷积神经网络,从而有效处理实时数据,避免决策的滞后性。策略和评估网络的输入均为第一视角下的无人车路况信息,策略网络的输出为方向盘转角的选择概率,评估网络的输出为当前无人车所处状态的危险度。 为了验证算法的有效性,本文利用开源的无人车仿真平台,实现自动驾驶训练数据的采集以及处理。对策略和评估网络进行数小时的训练,该算法在仿真平台中能够有效避开障碍物并达到指定目的地。最后,本文设计并实现了一个低成本的微缩智能车硬件测试平台,并在实验室环境下完成了数据采集,网络训练,算法测试等流程。最终实验结果表明,该算法在转弯,避障以及路径规划等方面都能够学习到人类的知识,能够在特地场景下拥有不错的自动驾驶表现。 |
作者: | 迟森 |
专业: | 电路与系统 |
导师: | 王骄 |
授予学位: | 硕士 |
授予学位单位: | 东北大学 |
学位年度: | 2020 |