当前位置: 首页> 学位论文 >详情
原文传递 基于平均奖励的强化学习退还发在离散时间系统最优控制中的应用研究
论文题名: 基于平均奖励的强化学习退还发在离散时间系统最优控制中的应用研究
关键词: 奖励;强化学习;离散时间;系统最优控制
作者: 胡一帆
专业: 应用数学
导师: 温广辉
授予学位: 硕士
授予学位单位: 东南大学
学位年度: 2021
检索历史
应用推荐