当前位置: 首页> 交通专利数据库 >详情
原文传递 包括运用部分可观察马尔可夫决策过程模型示例的自主车辆操作管理
专利名称: 包括运用部分可观察马尔可夫决策过程模型示例的自主车辆操作管理
摘要: 自主车辆操作管理可以包括由自主车辆穿越车辆交通运输网。穿越所述车辆交通运输网可以包括:运用特定情景操作控制评估模块示例,其中,所述特定情景操作控制评估模块示例是特定情景操作控制评估模块的示例,其中,所述特定情景操作控制评估模块实施部分可观察马尔可夫决策过程。穿越所述车辆交通运输网包括:接收来自于所述特定情景操作控制评估模块示例的候选的车辆控制动作;并且基于所述候选的车辆控制动作来穿越所述车辆交通运输网的一部分。
专利类型: 发明专利
国家地区组织代码: 美国;US
申请人: 日产北美公司
发明人: K.雷;S.维特维奇;S.齐伯斯坦;L.佩德森
专利状态: 有效
申请日期: 2017-02-10T00:00:00+0800
发布日期: 2019-11-08T00:00:00+0800
申请号: CN201780085381.X
公开号: CN110431037A
代理机构: 北京市柳沈律师事务所
代理人: 邸万奎
分类号: B60K31/00(2006.01);B;B60;B60K;B60K31
申请人地址: 美国田纳西州
主权项: 1.一种在穿越车辆交通运输网时使用的方法,所述方法包括: 由自主车辆穿越车辆交通运输网,其中,穿越所述车辆交通运输网包括: 运用特定情景操作控制评估模块示例,其中,所述特定情景操作控制评估模块示例是特定情景操作控制评估模块的示例,其中,所述特定情景操作控制评估模块实施部分可观察马尔可夫决策过程; 接收来自于所述特定情景操作控制评估模块示例的候选的车辆控制动作;以及 基于所述候选的车辆控制动作来穿越所述车辆交通运输网的一部分。 2.根据权利要求1所述的方法,其中,穿越所述车辆交通运输网的所述部分包括:根据经识别的路线来穿越所述车辆交通运输网的所述部分。 3.根据权利要求1所述的方法,其中,所述特定情景操作控制评估模块示例与外部对象相关联,所述外部对象距所述自主车辆不超出限定的地理空间距离。 4.根据权利要求1所述的方法,其中,所述特定情景操作控制评估模块示例是来自于多个特定情景操作控制评估模块的特定情景操作控制评估模块的示例。 5.根据权利要求4所述的方法,其中,来自所述多个特定情景操作控制评估模块的每个特定情景操作控制评估模块对独特的车辆操作情景进行建模。 6.根据权利要求1所述的方法,其中,运用所述特定情景操作控制评估模块示例包括:根据所述特定情景操作控制评估模块示例对独特的车辆操作情景进行建模。 7.根据权利要求6所述的方法,其中,对所述独特的车辆操作情景进行建模包括对传感器不确定性进行建模。 8.根据权利要求6所述的方法,其中,对所述独特的车辆操作控制情景进行建模包括: 从所述自主车辆的传感器接收传感器信息; 基于所述传感器信息来对所述独特的车辆操作控制情景进行建模。 9.根据权利要求8所述的方法,其中,接收所述传感器信息包括: 从所述自主车辆的传感器信息处理单元接收经处理的传感器信息,所述传感器信息处理单元从所述自主车辆的所述传感器接收所述传感器信息,并且基于所述传感器信息生成所述经处理的传感器信息。 10.根据权利要求8所述的方法,其中,对所述独特的车辆操作控制情景进行建模包括: 接收表示所述车辆交通运输网的车辆交通运输网信息; 基于所述传感器信息和所述车辆交通运输网信息来对所述独特的车辆操作控制情景进行建模。 11.根据权利要求6所述的方法,其中,对所述独特的车辆操作控制场景情景进行建模包括: 从堵塞监测器示例接收关于所述车辆交通运输网的所述部分的可用性的概率; 基于所述可用性的概率来对所述独特的车辆操作控制情景进行建模。 12.根据权利要求11所述的方法,其中,对所述独特的车辆操作控制情景进行建模包括: 识别多个状态; 识别多个车辆控制动作; 识别多个条件性转换概率,其中,来自于所述多个条件性转换概率的每个条件性转换概率表示:从来自于所述多个状态的相应的第一状态转换到来自于所述多个状态的相应的第二状态的概率; 识别奖励函数,其中,所述奖励函数生成与从来自于所述多个状态的相应的第一状态转换到来自于所述多个状态的相应的第二状态相对应的奖励; 识别多个观察,其中,所述可用性的概率是所述多个观察中的一个,并且其中,所述传感器信息包括观察的概率中的一者或多者;以及 识别多个条件性观察概率,其中,来自于所述多个条件性观察概率的每个条件性观察概率指示关于来自于所述多个观察的相应的观察的准确性的概率。 13.根据权利要求12所述的方法,其中,所述多个状态包括以下项中的一者或多者: 所述自主车辆的当前地理空间位置的指示; 所述自主车辆的运动状态的指示; 所述自主车辆在所述当前地理空间位置处的时间段的指示; 所述外部对象的当前地理空间位置的指示; 所述外部对象的运动状态的指示; 与所述外部对象相对应的可用性的概率的指示;或者 所述自主车辆相对于所述外部对象的优先级的指示。 14.根据权利要求12所述的方法,其中,所述多个车辆控制动作包括以下项中的一者或多者: 停止车辆控制动作; 等待车辆控制动作; 加速车辆控制动作; 减速车辆控制动作; 前进车辆控制动作;或 继续行进车辆控制动作。 15.根据权利要求12所述的方法,其中,在从来自于所述多个状态的所述相应的第一状态向来自于所述多个状态的所述相应的第二状态的转换包括违反车辆交通运输网规则的情况下,所述奖励函数生成处罚。 16.根据权利要求12所述的方法,其中,在实施所述部分可观察马尔可夫决策过程的所述特定情景操作控制评估模块是不可用的情况下,穿越所述车辆交通运输网包括: 运用如下特定情景操作控制评估模块示例:所述特定情景操作控制评估模块示例是实施马尔可夫决策过程的特定情景操作控制评估模块的示例。 17.根据权利要求16所述的方法,其中,对作为实施所述马尔可夫决策过程的所述特定情景操作控制评估模块的所述示例的所述特定情景操作控制评估模块示例的运用包括: 生成所述特定情景操作控制评估模块; 对所述特定情景操作控制评估模块进行解析;以及 对所述特定情景操作控制评估模块示例进行实例化。 18.一种在穿越车辆交通运输网时使用的方法,所述方法包括: 由自主车辆穿越车辆交通运输网,其中,穿越所述车辆交通运输网包括: 对如下特定情景操作控制评估模块示例进行实例化:所述特定情景操作控制评估模块示例是实施部分可观察马尔可夫决策过程的特定情景操作控制评估模块的示例,所述实施部分可观察马尔可夫决策过程的特定情景操作控制评估模块对独特的车辆操作控制情景进行建模,其中,对所述独特的车辆操作控制情景进行建模包括: 识别对应于所述独特的车辆操作控制情景的多个状态; 基于所述独特的车辆操作控制情景来识别多个可用的车辆控制动作; 识别多个条件性转换概率,其中,来自于所述多个条件性转换概率的每个条件性转换概率表示:从来自于所述多个状态的相应的第一状态转换到来自于所述多个状态的相应的第二状态的概率; 识别奖励函数,其中,所述奖励函数生成与从来自于所述多个状态的相应的第一状态转换到来自于所述多个状态的相应的第二状态相对应的奖励; 识别多个观察,来自于所述多个观察的每个观察对应于来自于所述多个状态的相应的状态;以及 识别多个条件性观察概率,其中,来自于所述多个条件性观察概率的每个条件性观察概率指示关于来自于所述多个观察的相应的观察的准确性的概率; 接收来自于所述特定情景操作控制评估模块示例的候选的车辆控制动作;以及 基于所述候选的车辆控制动作来穿越所述车辆交通运输网的一部分。 19.一种自主车辆,包括: 处理器,所述处理器被配置为执行存储在非暂时性计算机可读介质上的指令以: 运用特定情景操作控制评估模块示例,其中,所述特定情景操作控制评估模块示例是特定情景操作控制评估模块的示例,其中,所述特定情景操作控制评估模块实施部分可观察马尔可夫决策过程; 接收来自于所述特定情景操作控制评估模块示例的候选的车辆控制动作;以及 基于所述候选的车辆控制动作来控制所述自主车辆以穿越所述车辆交通运输网的一部分。 20.根据权利要求19所述的自主车辆,其中,所述处理器被配置为执行存储在所述非暂时性计算机可读介质上的指令以运用所述特定情景操作控制评估模块示例,从而: 识别关于独特的车辆操作情景的多个状态; 识别关于所述独特的车辆操作情景的多个车辆控制动作; 识别多个条件性转换概率,其中,来自于所述多个条件性转换概率的每个条件性转换概率表示:从来自于所述多个状态的相应的第一状态转换到来自于所述多个状态的相应的第二状态的概率; 识别奖励函数,其中,所述奖励函数生成与从来自于所述多个状态的相应的第一状态转换到来自于所述多个状态的相应的第二状态相对应的奖励; 识别多个观察,来自于所述多个观察的每个观察对应于来自于所述多个状态的相应的状态;以及 识别多个条件性观察概率,其中,来自于所述多个条件性观察概率的每个条件性观察概率指示:关于来自于所述多个观察的相应的观察的准确性的概率。
所属类别: 发明专利
检索历史
应用推荐