专利名称: |
具有自动辅助的自主车辆操作 |
摘要: |
提供了用于控制车辆的系统和方法。在一个实施例中,一种车辆包括:一个或多个车载感测装置;一个或多个车载致动器;以及控制器,其由处理器从一个或多个感测装置获取传感器数据,至少部分地基于传感器数据来识别辅助事件,至少部分地基于传感器数据和自主辅助策略来确定对辅助事件的自动响应,并且根据自动响应而自主地操作车辆上的一个或多个致动器。在示例性实施例中,使用逆向加强学习来确定自主辅助策略以优化回报函数并模仿远程人类辅助器。 |
专利类型: |
发明专利 |
国家地区组织代码: |
美国;US |
申请人: |
通用汽车环球科技运作有限责任公司 |
发明人: |
B·温斯坦劳恩 |
专利状态: |
有效 |
申请日期: |
2018-11-22T00:00:00+0800 |
发布日期: |
2019-06-11T00:00:00+0800 |
申请号: |
CN201811396173.4 |
公开号: |
CN109866778A |
代理机构: |
中国专利代理(香港)有限公司 |
代理人: |
吴超;刘茜 |
分类号: |
B60W50/00(2006.01);B;B60;B60W;B60W50 |
申请人地址: |
美国密歇根州 |
主权项: |
1.一种车辆,包括: 所述车辆上的一个或多个感测装置; 数据存储元件,其用于维护自主辅助策略; 所述车辆上的一个或多个致动器;以及 控制器,其由处理器从所述一个或多个感测装置获取传感器数据,至少部分地基于所述传感器数据来识别辅助事件,至少部分地基于所述传感器数据和所述自主辅助策略来确定对所述辅助事件的自动响应,并且根据所述自动响应而自主地操作所述车辆上的所述一个或多个致动器。 2.根据权利要求1所述的车辆,其中所述辅助事件包括传感器异常、环境危害、机械损伤或由所述控制器确定的违反与操作所述车辆相关联的一个或多个约束的用于至少部分地基于所述传感器数据而自主操作所述车辆的路径之一。 3.根据权利要求1所述的车辆,进一步包括通信系统,所述通信系统耦合到网络以通过所述网络从远程装置获取所述自主辅助策略,其中所述自主辅助策略通过所述远程装置使用逆向加强学习来确定,以确定用于基于远程辅助请求状态数据与远程辅助响应数据之间的关系来修改车辆状态的回报函数。 4.根据权利要求1所述的车辆,其中: 所述控制器至少部分地基于所述传感器数据来确定所述车辆的当前状态;并且 所述自动响应包括用于基于所述自主辅助策略将所述车辆从所述当前状态转变为第二状态的动作。 5.一种控制车辆的方法,所述方法包括: 通过所述车辆的控制模块从所述车辆上的一个或多个感测装置获取传感器数据; 通过所述控制模块至少部分地基于所述传感器数据来识别辅助事件; 通过所述控制模块从远程装置获取自主辅助策略; 通过所述控制模块至少部分地基于所述传感器数据和所述自主辅助策略来确定对所述辅助事件的自动响应;以及 通过所述控制模块根据所述自动响应来自主地操作所述车辆上的一个或多个致动器。 6.根据权利要求5所述的方法,其中识别所述辅助事件包括检测传感器异常、环境危害或机械损伤中的至少一个。 7.根据权利要求5所述的方法,其中识别所述辅助事件包括检测由用于自主操作所述车辆的控制方案确定的路径违反与操作所述车辆相关联的一个或多个约束。 8.根据权利要求5所述的方法,其中: 确定所述自动响应包括: 至少部分地基于所述传感器数据来确定所述车辆的当前状态;以及 确定用于基于所述自主辅助策略将所述车辆从所述当前状态转变为第二状态的动作;以及 自主地操作所述一个或多个致动器包括自主地操作所述一个或多个致动器以实现所述动作。 9.根据权利要求5所述的方法,进一步包括所述远程装置从多台车辆获取与远程辅助请求相关联的状态数据,获取与对所述远程辅助请求的远程辅助响应对应的响应数据,使用逆向加强学习确定用于基于所述状态数据与所述响应数据之间的关系修改车辆状态的回报函数,并且基于所述回报函数来确定所述自主辅助策略。 10.一种自主车辆控制系统,包括: 数据库,其用于维护与由多台车辆提供的辅助请求相关联的车辆状态数据和与对所述辅助请求的辅助响应对应的辅助响应数据;以及 耦合到所述数据库的服务器,其用于确定用于基于所述状态数据与所述响应数据之间的关系修改车辆状态的回报函数,确定用于基于所述回报函数来自主修改车辆状态的策略,并且通过网络向所述多台车辆中的至少一台提供所述策略,其中所述至少一台车辆上的一个或多个致动器以受所述策略影响的方式来自主操作。 |
所属类别: |
发明专利 |