详情

原文传递自动驾驶车辆的控制方法、装置、电子设备以及车辆

专利名称：	自动驾驶车辆的控制方法、装置、电子设备以及车辆
摘要：	本公开提供了自动驾驶车辆的控制方法、装置、电子设备以及车辆，涉及人工智能技术领域，尤其涉及自动驾驶技术领域。具体实现方案为：获取自动驾驶车辆和交互对象的候选驾驶策略的初始行驶收益；基于长期安全性需求和短期安全性需求，确定候选驾驶策略的初始行驶收益的最终行驶收益；长期安全性需求要求自动驾驶车辆和交互对象安全的通过目标地点；短期安全性需求要求自动驾驶车辆在第一时域内能够安全行驶；在基于最终行驶收益选择候选驾驶策略为目标驾驶策略的情况下，控制自动驾驶车辆执行目标驾驶策略。本公开实施例中，综合考虑了长期和短期行驶效益，可获取到有利于保证车辆行驶安全的目标驾驶策略。
专利类型：	发明专利
国家地区组织代码：	北京;11
申请人：	北京百度网讯科技有限公司
发明人：	刘金鑫;李文博;彭亮;陈泰然;包帅
专利状态：	有效
申请日期：	2023-08-01T00:00:00+0800
发布日期：	2023-11-10T00:00:00+0800
申请号：	CN202310961965.6
公开号：	CN117022320A
代理机构：	北京易光知识产权代理有限公司
代理人：	王英;金爱静
分类号：	B60W60/00;B;B60;B60W;B60W60;B60W60/00
申请人地址：	100085 北京市海淀区上地十街10号百度大厦2层
主权项：	1.一种自动驾驶车辆的控制方法，包括：获取自动驾驶车辆和交互对象的候选驾驶策略的初始行驶收益；基于长期安全性需求和短期安全性需求，确定所述候选驾驶策略的初始行驶收益的最终行驶收益；所述长期安全性需求要求所述自动驾驶车辆和所述交互对象安全的通过目标地点；所述短期安全性需求要求所述自动驾驶车辆在第一时域内能够安全行驶；在基于所述最终行驶收益选择所述候选驾驶策略为目标驾驶策略的情况下，控制所述自动驾驶车辆执行所述目标驾驶策略。 2.根据权利要求1所述的方法，其中，所述获取自动驾驶车辆和交互对象的候选驾驶策略的初始行驶收益，包括：获取所述候选驾驶策略对应的所述自动驾驶车辆的规划速度；基于所述规划速度，以及所述自动驾驶车辆到达所述自动驾驶车辆的前方最近障碍物所在位置所需的第一时长，确定所述候选驾驶策略的初始行驶收益。 3.根据权利要求2所述的方法，其中，所述基于长期安全性需求和短期安全性需求，确定所述候选驾驶策略的初始行驶收益的最终行驶收益，包括：在满足所述长期安全性需求且满足所述短期安全性需求的情况下，确定所述初始行驶收益为所述最终行驶收益；在不满足所述长期安全性需求的情况下，将所述初始行驶收益调整为默认的第一值；在不满足所述短期安全性需求的情况下，将用于计算所述初始行驶收益的目标函数中的目标子项调整为第二值，以基于所述目标函数更新所述初始行驶收益，得到所述最终行驶收益。 4.根据权利要求1所述的方法，其中，所述确定所述候选驾驶策略的初始行驶收益，包括：获取所述候选驾驶策略对应的所述自动驾驶车辆的规划速度以及所述交互对象的预估速度；基于所述规划速度，所述自动驾驶车辆到达所述自动驾驶车辆的前方最近障碍物所在位置所需的第一时长，确定所述自动驾驶车辆的第一子收益；以及，基于所述预估速度，所述交互对象到达所述交互对象的前方最近障碍物所在位置所需的第二时长，确定所述交互对象的第二子收益；其中，所述初始行驶收益包括所述第一子收益和所述第二子收益。 5.根据权利要求4所述的方法，其中，所述基于长期安全性需求和短期安全性需求，确定所述候选驾驶策略的初始行驶收益的最终行驶收益，包括：在满足所述长期安全性需求且满足所述短期安全性需求的情况下，确定所述初始行驶收益为所述最终行驶收益；在不满足所述长期安全性需求的情况下，将所述规划速度和所述预估速度中被更新的速度所对应的子收益更新为默认的第一值；其中，所述规划速度对应所述第一子收益，所述预估速度对应所述第二子收益；在不满足所述短期安全性需求的情况下，更新目标对象对应的子收益，以得到所述最终行驶收益；其中，在所述自动驾驶车辆不满足所述短期安全性需求的情况下，所述目标对象包括所述自动驾驶车辆；在所述交互对象不满足所述短期安全性需求的情况下，所述目标对象包括所述交互对象。 6.根据权利要求5所述的方法，其中，所述更新目标对象对应的子收益，包括：在所述自动驾驶车辆不满足所述短期安全性需求的情况下，将用于计算所述第一子收益的目标函数中的目标子项调整为第二值，以基于所述目标函数更新所述第一子收益；在所述交互对象不满足所述短期安全性需求的情况下，将用于计算所述第二子收益的目标函数中的目标子项调整为第二值，以基于所述目标函数更新所述第二子收益。 7.根据权利要求1-6中任一项所述的方法，还包括：确定所述自动驾驶车辆和所述交互对象通过目标地点的时间差；在所述时间差在第一安全范围内的情况下，确定满足所述长期安全性需求；在所述时间差不在所述第一安全范围内的情况下，确定不满足所述长期安全性需求。 8.根据权利要求7所述的方法，还包括：在满足所述长期安全性需求，且所述时间差与所述第一安全范围的最低临界值的第一差值小于第一差距阈值的情况下，更新目标速度以使得所述第一差值大于所述第一差距阈值且满足所述长期安全性需求；其中，所述目标速度包括所述自动驾驶车辆的规划速度和/或所述交互对象的预估速度。 9.根据权利要求7所述的方法，其中，所述确定所述自动驾驶车辆和所述交互对象通过目标地点的时间差，包括：确定所述自动驾驶车辆的规划轨迹以及所述交互对象的预测轨迹的交汇点，得到所述目标地点；基于所述自动驾驶车辆的规划速度，确定所述自动驾驶车辆到达所述目标地点的第一时长；以及，基于所述交互对象的预估速度，确定所述交互对象到达所述目标地点的第二时长；确定所述第一时长和所述第二时长之间的差值，得到所述时间差。 10.根据权利要求2-9中任一项所述的方法，还包括：确定所述自动驾驶车辆和所述自动驾驶车辆的前方最近障碍物之间的第一距离；基于所述自动驾驶车辆的规划速度，确定所述自动驾驶车辆行驶所述第一距离所需的第一时长；在所述第一时长在第二安全范围内的情况下，确定所述自动驾驶车辆满足所述短期安全性需求；在所述第一时长不在所述第二安全范围内的情况下，确定所述自动驾驶车辆不满足所述短期安全性需求。 11.根据权利要求10所述的方法，还包括：在所述自动驾驶车辆满足所述短期安全性需求，且所述第一时长与所述第二安全范围的最低临界值之间的第二差值小于第二差距阈值的情况下，更新所述自动驾驶车辆的规划速度，以使得所述第二差值大于所述第二差距阈值且所述自动驾驶车辆满足所述短期安全性需求。 12.根据权利要求4-11中任一项所述的方法，还包括：确定所述交互对象和所述交互对象的前方最近障碍物之间的第二距离；基于所述交互对象的预估速度，确定所述交互对象行进所述第二距离所需的第二时长；在所述第二时长在第三安全范围内的情况下，确定所述交互对象满足所述短期安全性需求；在所述第二时长不在所述第三安全范围内的情况下，确定所述交互对象不满足所述短期安全性需求。 13.根据权利要求12所述的方法，还包括：在所述交互对象满足所述短期安全性需求，且所述第二时长与所述第三安全范围的最低临界值之间的第三差值小于第三差距阈值的情况下，更新所述交互对象的预估速度，以使得所述第三差值大于所述第三差距阈值且所述交互对象满足所述短期安全性需求。 14.一种自动驾驶车辆的控制装置，包括：获取模块，用于获取自动驾驶车辆和交互对象的候选驾驶策略的初始行驶收益；确定模块，用于基于长期安全性需求和短期安全性需求，确定所述候选驾驶策略的初始行驶收益的最终行驶收益；所述长期安全性需求要求所述自动驾驶车辆和所述交互对象安全的通过目标地点；所述短期安全性需求要求所述自动驾驶车辆在第一时域内能够安全行驶；控制模块，用于在基于所述最终行驶收益选择所述候选驾驶策略为目标驾驶策略的情况下，控制所述自动驾驶车辆执行所述目标驾驶策略。 15.根据权利要求14所述的装置，其中，所述获取模块，用于：获取所述候选驾驶策略对应的所述自动驾驶车辆的规划速度；基于所述规划速度，以及所述自动驾驶车辆到达所述自动驾驶车辆的前方最近障碍物所在位置所需的第一时长，确定所述候选驾驶策略的初始行驶收益。 16.根据权利要求15所述的装置，其中，所述确定模块，用于：在满足所述长期安全性需求且满足所述短期安全性需求的情况下，确定所述初始行驶收益为所述最终行驶收益；在不满足所述长期安全性需求的情况下，将所述初始行驶收益调整为默认的第一值；在不满足所述短期安全性需求的情况下，将用于计算所述初始行驶收益的目标函数中的目标子项调整为第二值，以基于所述目标函数更新所述初始行驶收益，得到所述最终行驶收益。 17.根据权利要求14所述的装置，其中，所述获取模块，用于：获取所述候选驾驶策略对应的所述自动驾驶车辆的规划速度以及所述交互对象的预估速度；基于所述规划速度，所述自动驾驶车辆到达所述自动驾驶车辆的前方最近障碍物所在位置所需的第一时长，确定所述自动驾驶车辆的第一子收益；以及，基于所述预估速度，所述交互对象到达所述交互对象的前方最近障碍物所在位置所需的第二时长，确定所述交互对象的第二子收益；其中，所述初始行驶收益包括所述第一子收益和所述第二子收益。 18.根据权利要求17所述的装置，其中，所述确定模块，包括：确定单元，用于在满足所述长期安全性需求且满足所述短期安全性需求的情况下，确定所述初始行驶收益为所述最终行驶收益；第一更新单元，用于在不满足所述长期安全性需求的情况下，将所述规划速度和所述预估速度中被更新的速度所对应的子收益更新为默认的第一值；其中，所述规划速度对应所述第一子收益，所述预估速度对应所述第二子收益；第二更新单元，用于在不满足所述短期安全性需求的情况下，更新目标对象对应的子收益，以得到所述最终行驶收益；其中，在所述自动驾驶车辆不满足所述短期安全性需求的情况下，所述目标对象包括所述自动驾驶车辆；在所述交互对象不满足所述短期安全性需求的情况下，所述目标对象包括所述交互对象。 19.根据权利要求18所述的装置，其中，所述第二更新单元，用于：在所述自动驾驶车辆不满足所述短期安全性需求的情况下，将用于计算所述第一子收益的目标函数中的目标子项调整为第二值，以基于所述目标函数更新所述第一子收益；在所述交互对象不满足所述短期安全性需求的情况下，将用于计算所述第二子收益的目标函数中的目标子项调整为第二值，以基于所述目标函数更新所述第二子收益。 20.根据权利要求14-19中任一项所述的装置，还包括长期安全性确定模块，用于：确定所述自动驾驶车辆和所述交互对象通过目标地点的时间差；在所述时间差在第一安全范围内的情况下，确定满足所述长期安全性需求；在所述时间差不在所述第一安全范围内的情况下，确定不满足所述长期安全性需求。 21.根据权利要求20所述的装置，还包括第一更新模块，用于：在满足所述长期安全性需求，且所述时间差与所述第一安全范围的最低临界值的第一差值小于第一差距阈值的情况下，更新目标速度以使得所述第一差值大于所述第一差距阈值且满足所述长期安全性需求；其中，所述目标速度包括所述自动驾驶车辆的规划速度和/或所述交互对象的预估速度。 22.根据权利要求20所述的装置，其中，所述长期安全性确定模块，包括：地点确定单元，用于确定所述自动驾驶车辆的规划轨迹以及所述交互对象的预测轨迹的交汇点，得到所述目标地点；时长确定单元，用于基于所述自动驾驶车辆的规划速度，确定所述自动驾驶车辆到达所述目标地点的第一时长；以及，基于所述交互对象的预估速度，确定所述交互对象到达所述目标地点的第二时长；时间差确定单元，用于确定所述第一时长和所述第二时长之间的差值，得到所述时间差。 23.根据权利要求15-22中任一项所述的装置，还包括第一短期安全性确定模块，用于：确定所述自动驾驶车辆和所述自动驾驶车辆的前方最近障碍物之间的第一距离；基于所述自动驾驶车辆的规划速度，确定所述自动驾驶车辆行驶所述第一距离所需的第一时长；在所述第一时长在第二安全范围内的情况下，确定所述自动驾驶车辆满足所述短期安全性需求；在所述第一时长不在所述第二安全范围内的情况下，确定所述自动驾驶车辆不满足所述短期安全性需求。 24.根据权利要求23所述的装置，还包括第二更新模块，用于：在所述自动驾驶车辆满足所述短期安全性需求，且所述第一时长与所述第二安全范围的最低临界值之间的第二差值小于第二差距阈值的情况下，更新所述自动驾驶车辆的规划速度，以使得所述第二差值大于所述第二差距阈值且所述自动驾驶车辆满足所述短期安全性需求。 25.根据权利要求17-24中任一项所述的装置，还包括第二短期安全性确定模块，用于：确定所述交互对象和所述交互对象的前方最近障碍物之间的第二距离；基于所述交互对象的预估速度，确定所述交互对象行进所述第二距离所需的第二时长；在所述第二时长在第三安全范围内的情况下，确定所述交互对象满足所述短期安全性需求；在所述第二时长不在所述第三安全范围内的情况下，确定所述交互对象不满足所述短期安全性需求。 26.根据权利要求25所述的装置，还包括第三更新模块，用于：在所述交互对象满足所述短期安全性需求，且所述第二时长与所述第三安全范围的最低临界值之间的第三差值小于第三差距阈值的情况下，更新所述交互对象的预估速度，以使得所述第三差值大于所述第三差距阈值且所述交互对象满足所述短期安全性需求。 27.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-13中任一项所述的方法。 28.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-13中任一项所述的方法。 29.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-13中任一项所述的方法。 30.一种车辆，包括如权利要求27所述的电子设备。
所属类别：	发明专利