当前位置: 首页> 学位论文 >详情
原文传递 基于强化学习的蓄电池储能系统的优化控制
论文题名: 基于强化学习的蓄电池储能系统的优化控制
关键词: 分布式发电;储能系统;强化学习;蓄电池;电动汽车;策略迭代
摘要: 以风能、太阳能等为代表性的分布式发电单元受到气候和天气影响,发电功率难以保证平稳,可能会引起频率和电压不稳,进而引起停电事故。为了解决这一问题,在具有分布式电源的系统中引入了储能装置。但是受环境影响,系统供电与用电负荷会出现不平衡的情况,从而导致蓄电池处于亏电状态或过充电状态,长期运行会降低蓄电池组的使用寿命,增加系统维护成本,因此选择合适的蓄电池控制策略具有重要的实际意义。
  本文研究了一个由分布式发电源、储能设备、用电负荷以及系统的能量管理中心组成的蓄电池储能系统。该储能系统可以与电网进行交互。发电量不足时可以从电网买电,除了供给负荷需求,系统中多余的电量可以卖给电网或向电网提供频率调节服务。系统中分布式发电功率、负荷需求功率、电价和调频的价格相互独立,具有很大的不确定性,本文将它们分别建模为Markov链来研究。蓄电池储能装置从当前状态转移到空和满两个特殊状态的逗留时间不服从指数分布,所以将该储能系统的优化控制问题建模为半Markov决策过程。本文采用基于模型的Sarsa算法来学习最优策略,从而使系统在满足负荷需求的基础上获得的长期收益最大。
  随着电动汽车产业的发展,电动汽车入网(vehicle-to-grid,V2G)正在成为研究热点。本文考虑将分布式发电装置引入V2G系统中。当发电量不足时,电动车可以从电网买电;当发电能力比较强时,除了供给电动车的用电需求,多余的发电量直接卖给电网。闲置在充电桩上的电动车可以与电网交互,根据自身电量的情况以及电价和调频价格的高低,决定向电网卖电或是提供频率调节服务。假设系统能够在决策周期的初始时刻获得系统的发电量和电价信息。将系统的优化控制问题建模为动态规划过程。用策略迭代的方法来获取最优策略,从而使该系统能够在满足自身需求的同时获取最大收益。
作者: 刘静
专业: 计算机应用技术
导师: 唐昊
授予学位: 硕士
授予学位单位: 合肥工业大学
学位年度: 2014
正文语种: 中文
检索历史
应用推荐