基于强化学习的固体氧化物燃料电池输出电压自抗扰控制研究

TM911.4%TP273; [目的]为提升固体氧化物燃料电池(solid oxide fuel cell,SOFC)系统性能及寿命,以100 kW SOFC系统为研究对象,探究在保证输出电压跟踪性能的同时,通过强化学习不断调整控制器系数以实现最佳的综合性能.[方法]建立基于机理的SOFC输出电压系统模型,采用改进型的非线性自抗扰控制器(nonlinear active disturbance rejection control,NLADRC),通过控制输入燃气流量,使输出电压很好地跟踪参考值.考虑到传统的单通道控制器无法同时满足多个目标,但若采用双通道控制器则会导致系统复杂性、成本和故障风险...

Full description

Saved in:
Bibliographic Details
Published in发电技术 Vol. 45; no. 6; pp. 1163 - 1172
Main Authors 管超骏, 雷正玲, 霍海波, 王芳, 姚国全, 刘涛
Format Journal Article
LanguageChinese
Published 上海海洋大学工程学院,上海市 浦东新区 201306%高性能舰船技术教育部重点实验室(武汉理工大学),湖北省 武汉市 430063%上海海事大学交通运输学院,上海市 浦东新区 201306 31.12.2024
Subjects
Online AccessGet full text
ISSN2096-4528
DOI10.12096/j.2096-4528.pgt.24017

Cover

More Information
Summary:TM911.4%TP273; [目的]为提升固体氧化物燃料电池(solid oxide fuel cell,SOFC)系统性能及寿命,以100 kW SOFC系统为研究对象,探究在保证输出电压跟踪性能的同时,通过强化学习不断调整控制器系数以实现最佳的综合性能.[方法]建立基于机理的SOFC输出电压系统模型,采用改进型的非线性自抗扰控制器(nonlinear active disturbance rejection control,NLADRC),通过控制输入燃气流量,使输出电压很好地跟踪参考值.考虑到传统的单通道控制器无法同时满足多个目标,但若采用双通道控制器则会导致系统复杂性、成本和故障风险增加,提出一种基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)的改进型非线性自抗扰控制器,对非线性误差反馈控制律系数进行实时调节和优化.[结果]所设计控制器可在不违反燃料利用约束的情况下提高SOFC输出电压跟踪性能.[结论]所设计控制器具备适应性强、稳定性高和能克服不确定性等优点,为实际SOFC系统的输出电压控制器设计提供理论参考.
ISSN:2096-4528
DOI:10.12096/j.2096-4528.pgt.24017