LQR控制器简介
线性二次型调节器(Linear Quadratic Regulator,LQR)是一种最优控制方法,它通过最小化二次型性能指标(cost function)来实现对线性系统的最优控制。
基本原理
LQR控制器的设计基于以下线性系统状态方程:
其中:
- x 是状态向量
- u 是控制输入
- A 是系统矩阵
- B 是输入矩阵
代价函数(Cost Function)
LQR的性能指标(代价函数)定义为:
其中:
- Q 是半正定权重矩阵,用于平衡状态变量的重要性
- R 是正定权重矩阵,用于权衡控制输入的代价
- J 是需要最小化的性能指标
代价函数J的物理意义
代价函数J表示系统整个控制过程中的总"代价"或"损失",它由两部分组成:
- 状态偏差代价():表示系统状态与期望状态之间偏差的积分,反映系统对状态跟踪的精度要求
- 控制能量代价():表示控制输入所消耗的能量积分,反映控制过程中的能量消耗
积分上限为无穷大(∞)意味着考虑了整个控制过程的性能,而不仅仅是某个时刻的瞬时状态。
Q矩阵(状态权重矩阵)的影响
Q矩阵主要影响系统状态变量的控制效果:
- 增大Q矩阵元素:对应状态变量的偏差将被更快地抑制,但可能导致更大的控制输入
- 减小Q矩阵元素:对应状态变量的响应会变慢,但控制输入相对温和
- Q矩阵的对角元素可以不同:可以对不同状态变量赋予不同的重要程度
R矩阵(控制权重矩阵)的影响
R矩阵主要影响控制输入的幅值和能耗:
- 增大R矩阵元素:降低控制输入的幅值,使控制更加温和,但响应可能变慢
- 减小R矩阵元素:允许更大的控制输入,获得更快的响应,但可能增加能耗和超调
- R矩阵的对角元素可以不同:可以对不同执行器的使用强度进行差异化控制
Q和R的平衡
Q和R矩阵的选择体现了控制性能和控制代价这两个相互冲突的目标之间的权衡:
- Q/R比值较大:追求快速的状态调节,接受较大的控制代价
- Q/R比值较小:追求节省控制能耗,接受较慢的状态调节
求解最优控制律
要通过LQR(线性二次调节器)控制器实现最优控制,核心是计算出最优反馈增益矩阵 K。对于线性系统 对于线性系统 和性能指标(代价函数)
最优控制律为:
计算 K 的步骤如下:
- 求解代数黎卡提方程 (Algebraic Riccati Equation, ARE): 需要找到以下连续时间代数黎卡提方程的唯一对称正定解 P:
其中:
- A 是系统矩阵。
- B 是输入矩阵。
- Q 是状态权重矩阵(半正定)。
- R 是控制输入权重矩阵(正定)。
- 计算最优增益 K: 一旦得到 P,最优反馈增益 K 可以通过下式计算: