基于强化学习的固体氧化物燃料电池输出电压自抗扰控制研究
TM911.4%TP273; [目的]为提升固体氧化物燃料电池(solid oxide fuel cell,SOFC)系统性能及寿命,以100 kW SOFC系统为研究对象,探究在保证输出电压跟踪性能的同时,通过强化学习不断调整控制器系数以实现最佳的综合性能.[方法]建立基于机理的SOFC输出电压系统模型,采用改进型的非线性自抗扰控制器(nonlinear active disturbance rejection control,NLADRC),通过控制输入燃气流量,使输出电压很好地跟踪参考值.考虑到传统的单通道控制器无法同时满足多个目标,但若采用双通道控制器则会导致系统复杂性、成本和故障风险...
Saved in:
| Published in | 发电技术 Vol. 45; no. 6; pp. 1163 - 1172 |
|---|---|
| Main Authors | , , , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
上海海洋大学工程学院,上海市 浦东新区 201306%高性能舰船技术教育部重点实验室(武汉理工大学),湖北省 武汉市 430063%上海海事大学交通运输学院,上海市 浦东新区 201306
31.12.2024
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 2096-4528 |
| DOI | 10.12096/j.2096-4528.pgt.24017 |
Cover
| Summary: | TM911.4%TP273; [目的]为提升固体氧化物燃料电池(solid oxide fuel cell,SOFC)系统性能及寿命,以100 kW SOFC系统为研究对象,探究在保证输出电压跟踪性能的同时,通过强化学习不断调整控制器系数以实现最佳的综合性能.[方法]建立基于机理的SOFC输出电压系统模型,采用改进型的非线性自抗扰控制器(nonlinear active disturbance rejection control,NLADRC),通过控制输入燃气流量,使输出电压很好地跟踪参考值.考虑到传统的单通道控制器无法同时满足多个目标,但若采用双通道控制器则会导致系统复杂性、成本和故障风险增加,提出一种基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)的改进型非线性自抗扰控制器,对非线性误差反馈控制律系数进行实时调节和优化.[结果]所设计控制器可在不违反燃料利用约束的情况下提高SOFC输出电压跟踪性能.[结论]所设计控制器具备适应性强、稳定性高和能克服不确定性等优点,为实际SOFC系统的输出电压控制器设计提供理论参考. |
|---|---|
| ISSN: | 2096-4528 |
| DOI: | 10.12096/j.2096-4528.pgt.24017 |