系统新增OA期刊资源的通知
登 录
|
IP登 录
|
注 册
|
知识中心首页
联系我们
版权声明
首 页
交科信研
信息资源
专题数据库
"一带一路"交通基础设施
网上展厅
沥青路面典型病害样本数据集
知识应用
交通综合经济运行分析
交通科技发展态势
全球港口通
信息服务
当前位置:
首页
>
学位论文
>
详情
原文传递
基于平均奖励的强化学习退还发在离散时间系统最优控制中的应用研究
论文题名:
基于平均奖励的强化学习退还发在离散时间系统最优控制中的应用研究
关键词:
奖励;强化学习;离散时间;系统最优控制
作者:
胡一帆
专业:
应用数学
导师:
温广辉
授予学位:
硕士
授予学位单位:
东南大学
学位年度:
2021
相关文献
基于强化学习的非线性切换系统最优控制方法研究
知识驱动的强化学习及其在交通拥堵控制中的应用研究
eLAA中基于强化学习的干扰控制策略研究
强化学习及其在城市交通信号控制中的应用研究
基于强化学习的多智能体系统最优一致性
深度强化学习在基于车车通信的列控系统中的应用
检索历史
应用推荐