瑞利商(Rayleigh quotient)与广义瑞利商(genralized Rayleigh quotient)

  • Post author:
  • Post category:其他


我们首先来看看瑞利商的定义。瑞利商是指这样的函数



R

(

A

,

x

)

R(A,x)






R


(


A


,




x


)





:





R

(

A

,

x

)

=

x

H

A

x

x

H

x

R(A,x )=\frac{x^HAx}{x^Hx}






R


(


A


,




x


)




=




















x










H









x















x










H









A


x























其中



x

x






x





为非零向量,而



A

A






A





为n×n的Hermitan矩阵。所谓的Hermitan矩阵就是满足共轭转置矩阵和自己相等的矩阵,即



A

H

=

A

A^H=A







A










H











=








A





。如果我们的矩阵A是实矩阵,则满足



A

T

=

A

A^T=A







A










T











=








A





的矩阵即为Hermitan矩阵。

瑞利商



R

(

A

,

x

)

R(A,x)






R


(


A


,




x


)





有一个非常重要的性质,即它的最大值等于矩阵



A

A






A





最大的特征值,而最小值等于矩阵



A

A






A





的最小的特征值,也就是满足:





λ

m

i

n

x

H

A

x

x

H

x

λ

m

a

x

λmin ≤\frac{x^HAx}{x^Hx} ≤λmax






λ


m


i


n

























x










H









x















x










H









A


x































λ


m


a


x







具体的证明这里就不给出了。当向量



x

x






x





是标准正交基时,即满足



x

H

x

=

1

x^Hx=1







x










H









x




=








1





时,瑞利商退化为:



R

(

A

,

x

)

=

x

H

A

x

R(A,x)=x^HAx






R


(


A


,




x


)




=









x










H









A


x





,这个形式在谱聚类和PCA中都有出现。

以上就是瑞利商的内容,现在我们再看看广义瑞利商。广义瑞利商是指这样的函数



R

(

A

,

B

,

x

)

R(A,B,x)






R


(


A


,




B


,




x


)





:





R

(

A

,

x

)

=

x

H

A

x

x

H

B

x

R(A,x)=\frac{x^HAx}{x^HBx}






R


(


A


,




x


)




=




















x










H









B


x















x










H









A


x

























其中



x

x






x





为非零向量,而



A

,

B

A,B






A


,




B





为n×n的Hermitan矩阵。B为正定矩阵。它的最大值和最小值是什么呢?其实我们只要通过将其通过标准化就可以转化为瑞利商的格式。我们令



x

=

B

1

2

x

x=B^{−\frac{1}{2}} x ′






x




=









B


























2
















1





























x








,则分母转化为:





x

H

B

x

=

x

H

(

B

1

2

)

H

B

B

1

2

x

=

x

H

B

1

2

B

B

1

2

x

=

x

H

x

x^HBx=x ′^H (B^{−\frac{1}{2}})^H BB^{−\frac{1}{2}}x′ =x ′^HB^{−\frac{1}{2}} BB ^{−\frac{1}{2}} x ′ =x′^Hx′







x










H









B


x




=








x














H









(



B


























2
















1






























)










H









B



B


























2
















1





























x







=








x














H










B


























2
















1





























B



B


























2
















1





























x







=








x














H









x










而分子转化为:





x

H

A

x

=

x

H

B

1

2

A

B

1

2

x

x^HAx=x′^HB^{−\frac{1}{2}}AB^{−\frac{1}{2}}x′







x










H









A


x




=








x














H










B


























2
















1





























A



B


























2
















1





























x








此时我们的



R

(

A

,

B

,

x

)

R(A,B,x)






R


(


A


,




B


,




x


)





转化为



R

(

A

,

B

,

x

)

R(A,B,x ′)






R


(


A


,




B


,




x





)





:





R

(

A

,

B

,

x

)

=

x

H

B

1

2

A

B

1

2

x

x

H

x

R(A,B,x ′ )=\frac{x′^HB^{−\frac{1}{2}} AB^{−\frac{1}{2}}x′}{x′^Hx′}






R


(


A


,




B


,




x





)




=



















x














H









x

















x














H










B


























2
















1





























A



B


























2
















1





























x


























利用前面的瑞利商的性质,我们可以很快的知道,



R

(

A

,

B

,

x

)

R(A,B,x ′ )






R


(


A


,




B


,




x





)





的最大值为矩阵



B

1

2

A

B

1

2

B^{−\frac{1}{2}} AB^{−\frac{1}{2}}







B


























2
















1





























A



B


























2
















1
































的最大特征值,或者说矩阵



B

1

A

B^{−1}A







B














1










A





的最大特征值,而最小值为矩阵



B

1

A

B^{−1}A







B














1










A





的最小特征值。即对矩阵进行标准化。