1.4.0
参数估计基础
在实际问题中,发现信号的基础上,还需要测定信号的参数,但由于信号要受到随机噪声的污染,不可能精确的测定信号的参数,需要使用统计估计的方法尽可能精确地对其估计。如果信号参数是随机变量或非随机的未知量,则称为信号的参数估计;若被估计量是随机过程或者非随机的未知过程,则称为波形估计或状态估计。因此,信号的参数估计是指被估计参数在观测时间内不随时间变化,属静态估计;波形或状态估计涉及的信号参数是随时间变化的,属动态估计。
为了对信号的参数做出估计,需要获得观测数据。设观测方程为
,k=1,2,…,N
其中,
是第k次观测值;
是被估计量;
是第k次测量噪声;
是已知的观测系数。
现在的问题是根据N次观测值
按照某种最佳估计准则,对参数
做出估计。即构造一个观测量的函数,即
,作为参数
的估计值。
如果被估计量是p维矢量
,那么观测方程一般可以表示为
,k=1,2,…,N
式中,
是第k次观测的q维观测矢量,
是p维被估计矢量,
是第k次观测的q维观测噪声矢量,
是
阶观测矩阵。
信号参数估计的统计模型
1.4.1 常用代价函数与贝叶斯估计
在信号估计问题中,因为被估计问题θ和估计量
是连续随机变量。所以每一对
分配一个代价函数
。代价函数C是θ和
两个变量的函数。
但实际上,我们把它规定为误差
的函数,即
,是估计误差的但变量函数。
The cost function C(x) is typically one of the following :
1.4.1.1 误差平方代价函数(Quadratic Cost Solution)
(MMSE estimator)
1.4.1.2 误差绝对值代价函数(Absolute Cost Solution)
(posteriori median estimator)
1.4.1.3 均匀代价函数(Hit-or-miss)
(Maximum a Posteriori (MAP) estimator)
除上述三种之外,还可以选择其他形式的代价函数,但无论何种形式的代价都应满足两个特性:非负性和误差
趋于零的最小性。
1.4.1.4 贝叶斯估计
被估计量
是随机变量,其先验概率密度为
,那么
是随机参量
和观测量z的函数,因此,平均代价
为:
使平均代价
最小的估计
就是贝叶斯估计。
利用概率论中的条件概率公式
平均代价公式可改写为
由于上式对
的内积分非负,因而C最小等效为内积分最小,即
称为条件平均代价。它对
求最小,就能得到参量
的贝叶斯估计
Bayesian estimators are defined by a minimization problem which seeks for the value of
that minimizes the average cost.
1.4.2 最小均方误差估计
使用平方代价函数的贝叶斯估计使最小均方误差估计
推导:
将平方代价函数的条件平均代价用
表示,
使条件平均代价最小的一个必要条件是上式对
,求导并令结果等于0来求得最佳的
,即
因为
所以
求二阶导
故
是对应的平均代价的极小值,由于它使均方误差估计最小,因而称为最小均方误差估计。由于
也是
的条件均值
,故最小均方误差估计又称条件均值估计。
1.4.3最大后验估计
对于均匀代价函数,条件平均代价用
表示为
其中
是使条件代价
最小的估计量,欲使
最小,需使右边积分值最大。应当选择
使它处于后验概率密度
最大处的
值,这样求得的估计量称为最大后验概率估计,记为
。
如果最大值处于
的允许范围内,且
有连续的一阶导数,则获得最大值的必要条件是
因为自然对数是自变量的单调函数,所以有
上式称为最大后验方程,利用上式求解时,每一种情况下都需要检验所求得的解是否绝对最大。
1.4.4 最大似然估计
利用贝叶斯公式
将最大后验方程写成
当被估计量
是未知先验分布的随机参量或是非随机未知参量时,上式含有未知量,不能采用上式求估计值。这时设想只用其中的第一项,即取似然函数
的最大值对应的
作为估计量,则称之为最大似然估计,其估计量记为
,可由方程:
或
求得。第二个对数求导公式称为最大似然方程。
由于ML没有或不能利用被估计参量的先验知识,因而其估计质量一般说要比贝叶斯估计差,也就是说,比最大后验估计差。
一个例子看懂最大后验(使用Hit or Miss代价函数的贝叶斯估计)和极大似然的区别
小明今天没来上学,三个可能的Hypothesis(θ):
小明今天生病了 / 美国总统特朗普会见小明 / 地球遭受陨石撞击
用极大似然(MLE)估计出来的θ_hat(对θ的估计)是“地球遭受陨石撞击”,因为
Likelihood(小明今天没来上学|地球遭受陨石撞击)= 1
而用最大后验求出来的是“小明今天生病了”,因为考虑了先验——“地球毁灭”和“特朗普会见小明”的概率都远低于“小明今天生病了”。
用“
奥卡姆剃刀
”解释这个现象是模型越复杂(宇宙模型》国际关系模型》生活模型),出现的(先验)概率越低。