使用极大似然法对逻辑回归中的参数进行估计的数学原理

  • Post author:
  • Post category:其他

1.极大似然估计中采样产生的样本需要满足一个重要假设,所有采样的样本都是独立同分布的。
2.极大似然估计是在模型已定,参数未知的情况下,估计模型中的具体参数。
3.极大似然估计的核心是让产生所采样的样本出现的概率最大。即利用已知的样本结果信息,反推具有最大可能导致这些样本结果出现的模型的参数值。
既然事情已经发生了,为什么不让这个出现的结果的可能性最大呢?这也就是最大似然估计的核心。
求最大似然函数估计值的一般步骤:
(1)写出似然函数;似然函数值的大小意味着这组样本值出现的可能性的大小,是个概率值。
(2)对似然函数取
ln
对数,并整理化简;对数函数是单调增函数,所以对数函数取最大值时,原函数也取得最大值。(对数函数
y=logax
,当
a>1
时单调递增,当
0<a<1
时单调递减。)
(3)求导数,令导数为0,得到似然方程;
(4)解似然方程,得到的参数即为所求;


下面使用极大似然法对逻辑斯蒂回归中的参数进行估计:
1.假设当前的样本为
{(x1,y1=1),(x2,y2=0),(x3,y3=1),(x4,y4=0),(x5,y5=0)}
,样本是满足独立同分布的。
2.模型为
P(Y=1|x)=11+exp(wx)
,表示一个样本
x
在该模型下预测值为1的概率,满足“模型已定,参数未知”的原则。
3.由于样本是满足独立同分布的,那么出现以上样本分布的总概率为下式,需要让产生这一组样本的概率最大。

P=P(Y=1|x=x1)P(Y=0|x=x2)P(Y=1|x=x3)P(Y=0|x=x4)P(Y=0|x=x5)



P(Y=1|x)=π(x),P(Y=0|x)=1π(x)
,则上式可以化为:


P=i=15[π(xi)]yi[1π(xi)](1yi)



以上即为逻辑斯蒂回归的似然函数,似然函数的值的大小意味着该样本值出现的可能性的大小。需要最大化这个似然函数,使得出现这组样本的概率最大。可以将上式化为对数似然函数,之后将实际模型带入,求得似然函数在最大值时参数的实际值。具体参考:
《统计学习方法》第六章逻辑斯蒂回归与最大熵模型学习笔记

参考:
一文搞懂极大似然估计
最大似然估计的学习,这个对数学原理讲的很清楚


版权声明:本文为wjlucc原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。