最优控制
理论主要探讨的是让
动力系统
以在最小成本来运作,若系统动态可以用一组
线性微分方程
表示,而其成本为
二次
泛函
,这类的问题称为线性二次(LQ)问题。此类问题的解即为
线性二次调节器
(英语:linear–quadratic regulator),简称
LQR
。
LQR是回授控制器,方程式在后面会提到。LQR是
LQG(线性二次高斯)问题
解当中重要的一部份。而LQG问题和LQR问题都是
控制理论
中最基础的问题之一。
控制机器(例如飞机)的控制器,或是控制制程(例如化学反应)的控制器,可以进行
最佳控制
,方式是先设定
成本函数
,再由工程师设定加权,利用数学
演算法
来找到使成本函数最小化的设定值。成本函数一般会定义为主要量测量(例如飞行高度或是制程温度)和理想值的偏差的和。演算法会设法调整
参数
,让这些不希望出现的偏差降到最小。而控制量的大小本身也会包括在成本函数中。
LQR演算法减少了工程师为了让控制器最佳化,而需付出的心力。不过工程师仍然要列出成本函数的相关参数,并且将结果和理想的设计目标比较。因此控制器的建构常会是
迭代
的,工程师在
模拟
过程中决定最佳控制器,再去调整参数让结果更接近设计目标。
在本质上,LQR演算法是找寻合适
状态回授控制器
的
自动化
方式。因此也常会有
控制工程
师用其他替代方式,例如
全状态回授
(也称为极点安置)的作法,此作法对控制器参数和控制器性能之间的关系比较明确。而LQR演算法的困难之处在找合适的
加权
因子,这也限制了以LQR控制器合成的相关应用。
LQG控制
(linear–quadratic–Gaussian control)的全名是
线性二次高斯控制
,是
控制理论
中的基础
最优控制
问题之一。此问题和存在
加性高斯白噪声
的
线性系统
有关。此问题是要找到最佳的输出回授律,可以让二次
费用
函数的期望值最小化。其输出量测假设受到高斯噪声的影响,其初值也是高斯随机向量。
在“使用线性控制律”的最佳控制假设下,可以用completion-of-squares论述进行推导
[1]
。此控制律即为
LQG控制器
,就是
卡尔曼滤波
(线性二次状态估测器,LQE)和
LQR控制器
的结合。
分离原理
指出状态估测器和状态回授可以独立设计。LQG控制可以应用在
线性时不变系统
及线性
时变系统
,产生容易计算以及实现的线性动态回授控制器。LQG控制器本身是一个类似其受控系统的动态系统,两者有相同的维度。
根据分离原理,在一些范围较宽可能是非线性的控制器中,LQG控制器仍然是最佳的。也就是说“使用非线性控制架构不一定可以改善费用泛函的期望值”。这个版本的分离原理是
随机控制的分离原理
(separation principle of stochastic control)提到就算过程及输出噪声源可能是非高斯
鞅
,只要其系统动态是线性的,其最佳控制仍可以分离为最佳状态估测器(不再是卡尔曼滤波器)及LQR控制器
[2]
[3]
。LQR控制器也有用来控制扰动的非线性系统
[4]
。