《矩阵论》学习笔记(三):第三章 矩阵分析及其应用
本章讲述矩阵分析的理论,其基础是高等数学分析。所有的定义、性质都是从从高等数学分析中引申出来的。
一、矩阵序列
1.1 什么是矩阵序列
-
1-矩阵序列提出的原因:
矩阵序列是对数列的推广。 -
2-矩阵序列的研究重点?
研究重点:常常研究的是矩阵序列的收敛问题。
解决方式:借助矩阵范数,将矩阵序列的收敛性问题→
\to
→正项数列的收敛性问题。
-
3-什么是矩阵序列?
1.2 矩阵序列的收敛
-
1-矩阵序列收敛/发散的定义
[矩阵序列的收敛等价于多个数列收敛] -
2-矩阵序列收敛的性质:
满足加法/乘法/逆的性质。 -
3-矩阵序列收敛的判断:
思路:借助矩阵范数,将矩阵序列的收敛性问题→
\to
→正项数列的收敛性问题。
设
A
∈
C
m
∗
n
A∈C^{m*n}
A∈Cm∗n,则有:
A
(
k
)
→
O
A^{(k)} \to O
A(k)→O的充要条件是:
∣
∣
A
(
k
)
∣
∣
→
0
||A^{(k)}|| \to 0
∣∣A(k)∣∣→0.
A
(
k
)
→
A
A^{(k)} \to A
A(k)→A的充要条件是:
∣
∣
A
(
k
)
−
A
∣
∣
→
0
||A^{(k)}-A|| \to 0
∣∣A(k)−A∣∣→0.
1.3 矩阵序列的有界
1.4 收敛矩阵的定义与性质
- 1-什么是收敛矩阵?
[前提A是方阵n*n] - 2-收敛矩阵的判断:
- A为收敛矩阵的充要条件:
ρ
(
A
)
<
1
\rho(A)<1
ρ(A)<1.
- A为收敛矩阵的充分条件:只要存在一种矩阵范数||.||,使得
∣
∣
A
∣
∣
<
1
||A||<1
∣∣A∣∣<1.
[根据矩阵谱半径的性质推出]
二、矩阵级数
2.1 什么是矩阵级数
-
1-矩阵级数提出的原因:
矩阵级数是对常数项级数概念的推广。
数学分析中的级数(幂级数)理论占有很重要的位置。所以要讨论矩阵级数。 -
2-矩阵级数的研究重点?
研究重点:矩阵级数的收敛问题、幂级数。
解决方式:借助矩阵范数,将矩阵级数的绝对收敛性问题→
\to
→正项级数的收敛性问题。
-
3-什么是矩阵级数?
∑
k
=
0
无
穷
A
(
k
)
\sum_{k=0}^{无穷}A^{(k)}
∑k=0无穷A(k):矩阵序列形成的无穷项和。
2.2 矩阵级数的收敛性
-
1-矩阵级数的部分和
S
(
k
)
S^{(k)}
S(k)
-
2-什么是矩阵级数的收敛?
[矩阵级数的收敛等价于多个常数项级数收敛]
2.3 矩阵级数的绝对收敛
- 1-什么是矩阵级数的绝对收敛?
[矩阵级数的绝对收敛等价于多个常数项级数绝对收敛] - 2-矩阵级数绝对收敛的性质
∑ k = 0 无 穷 A ( k ) \sum_{k=0}^{无穷}A^{(k)} ∑k=0无穷A(k) |
矩阵级数绝对收敛的性质 |
---|---|
性质1 | 绝对收敛级数的更序级数绝对收敛. |
性质2 | 矩阵级数绝对收敛的充要条件:正项级数收敛. |
性质3 | 矩阵级数收敛/绝对收敛,其则矩阵
∑ P A ( k ) Q \sum PA^{(k)}Q ∑PA(k)Q也收敛/绝对收敛. |
性质4 | 两矩阵级数绝对收敛,其按项相乘矩阵也绝对收敛. |
2.4 幂级数
-
1-什么是矩阵的幂级数?
[矩阵是方阵] -
2-幂级数与矩阵幂级数的关系:
已知幂级数的收敛半径r,则:
若方阵A满足ρ
(
A
)
<
r
\rho(A)<r
ρ(A)<r,则矩阵幂级数收敛;
若方阵A满足ρ
(
A
)
>
r
\rho(A)>r
ρ(A)>r,则矩阵幂级数发散;
若方阵A满足ρ
(
A
)
=
r
\rho(A)=r
ρ(A)=r,矩阵幂级数收敛性不确定.
- 3-矩阵幂级数收敛的判断:
- 方阵A的幂级数收敛的充要条件:
A为收敛矩阵,且收敛时,其和为(
I
−
A
)
−
1
(I-A)^{-1}
(I−A)−1.
[A为收敛矩阵,则要满足ρ
(
A
)
<
1
\rho(A)<1
ρ(A)<1].
- 借助
ρ
(
A
)
与
r
、
ρ
(
A
)
与
范
数
∣
∣
A
∣
∣
\rho(A)与r、\rho(A)与范数||A||
ρ(A)与r、ρ(A)与范数∣∣A∣∣的关系判断,
ρ
(
A
)
<
r
、
ρ
(
A
)
<
∣
∣
A
∣
∣
\rho(A)<r、\rho(A)<||A||
ρ(A)<r、ρ(A)<∣∣A∣∣.
[方阵幂级数的绝对收敛转换为复变量幂级数的绝对收敛].
三、矩阵函数
3.1 矩阵函数的定义
- 1-矩阵函数提出的原因:
矩阵函数是对一元函数概念的推广。
矩阵函数以矩阵为自变量且取值也是矩阵的一类函数。
矩阵函数的基础是矩阵序列和矩阵级数。 - 2-矩阵函数的定义?
矩阵函数是由一个收敛的矩阵幂级数的和定义的。
矩阵函数存在的条件:
1)A是方阵;
2)是矩阵幂级数的和;
3)ρ
(
A
)
<
r
\rho(A)<r
3.2 常见的矩阵函数与性质
- 常见的矩阵函数:
复平面
C n ∗ n C^{n*n} Cn∗n |
矩阵幂级数
A ∈ C n ∗ n A∈C^{n*n} A∈Cn∗n |
---|---|
指数函数
e z e^z ez |
矩阵指数函数
e A e^A eA |
三角函数
c o s z cosz cosz |
矩阵三角函数
c o s A cosA cosA |
三角函数
s i n z sinz sinz |
矩阵三角函数
s i n A sinA sinA |
- 常见矩阵函数的运算性质
- 指数运算:
e
A
e
B
≠
e
B
e
A
≠
e
A
+
B
e^Ae^B≠e^Be^A≠e^{A+B}
而是:若A
B
=
B
A
AB=BA
e
A
e
B
=
e
B
e
A
=
e
A
+
B
e^Ae^B=e^Be^A=e^{A+B}
->e
A
e
−
A
=
e
−
A
e
A
=
e
I
e^Ae^{-A}=e^{-A}e^A=e^I
->(
e
A
)
−
1
=
e
−
A
(e^A)^{-1}=e^{-A}
- 三角函数运算:
若A
B
=
B
A
AB=BA
c
o
s
(
A
+
B
)
=
c
o
s
A
c
o
s
B
−
s
i
n
A
s
i
n
B
cos(A+B)=cosAcosB-sinAsinB
c
o
s
2
A
=
c
o
s
2
A
−
s
i
n
2
A
cos2A=cos^2A-sin^2A
s
i
n
(
A
+
B
)
=
s
i
n
A
c
o
s
B
+
s
i
n
B
c
o
s
A
sin(A+B)=sinAcosB+sinBcosA
s
i
n
2
A
=
2
s
i
n
A
c
o
s
A
sin2A=2sinAcosA
3.3 矩阵函数值的求法
3.3.1 待定系数法
待定系数法求解步骤: | |
---|---|
1. 将矩阵A的特征多项式表达成特征值的因式 |
φ ( λ ) = d e t ( λ I − A ) = ∏ i = 1 s ( λ − x i ) r i \varphi(\lambda)=det(\lambda I-A)=\prod_{i=1}^s(\lambda-x_i)^{ri} φ(λ)=det(λI−A)=∏i=1s(λ−xi)ri |
2. 写出首1多项式.
ψ ( λ ) \psi(\lambda) ψ(λ) |
满足: 1) ψ ( λ ) = O \psi(\lambda)=O ψ(λ)=O; 2) ψ ( λ ) \psi(\lambda) ψ(λ)可以整除 φ ( λ ) . \varphi(\lambda). φ(λ). |
3. 用首1多项式表示函数
f ( z ) f(z) f(z) |
f ( z ) = ψ ( λ ) g ( z ) + r ( z ) f(z)=\psi(\lambda)g(z)+r(z) f(z)=ψ(λ)g(z)+r(z) |
4. 计算
r ( z ) → r ( A ) r(z) \to r(A) r(z)→r(A) |
f ( A ) = r ( A ) f(A)=r(A) f(A)=r(A) |
3.3.2 数项级数求和法
3.3.3 对角形法
当A相似于一个对角矩阵B时,可以将矩阵幂级数求和问题转化成求其相似变换矩阵的问题。
A
=
P
B
P
−
1
A=PBP^{-1}
A=PBP−1,
A
2
=
P
B
2
P
−
1
A^2=PB^2P^{-1}
A2=PB2P−1
f
(
A
)
=
∑
k
=
0
无
穷
c
k
A
k
=
P
[
.
.
.
]
P
−
1
f(A)=\sum_{k=0}^{无穷}c_kA^k=P[…]P^{-1}
f(A)=∑k=0无穷ckAk=P[...]P−1
注意:这里的P矩阵不唯一,但结果却总是相同的。
3.3.4 Jordan标准形法
矩阵幂级数求和问题可以转化成求矩阵的Jordan标准形及相似变换矩阵的问题。
3.4 矩阵函数的另一种定义
- 1-矩阵函数另一种定义提出的原因:
3.1中对矩阵的定义限制必须能够写成矩阵幂级数f
(
A
)
=
∑
c
k
A
f(A)=\sum c_kA
而对于任意的函数,不一定能展开成幂级数的形式。所以需要拓宽矩阵函数的定义。 - 2-矩阵函数的定义?
任意矩阵都相似于一个Jordan标准形矩阵。用Jordan标准形矩阵来定义矩阵函数f
(
A
)
f(A)
要求:函数f
(
z
)
f(z)
λ
i
\lambda_i
m
i
−
1
m_i-1
四、矩阵的微分与积分
4.1 什么是函数矩阵?
对
A
(
t
)
=
(
a
i
j
(
t
)
)
m
∗
n
A(t)=(a_{ij}(t))_{m*n}
A(t)=(aij(t))m∗n,
其中,矩阵A中每个元素
a
i
j
(
t
)
a_{ij}(t)
aij(t)都是t的函数,这样的矩阵称作函数矩阵。
4.2 函数矩阵的导数与积分
-
函数矩阵的导数:
矩阵函数的导数值等于对矩阵中每个元素求导得到的矩阵。 -
函数矩阵的积分:
矩阵函数的积分值等于对矩阵中每个元素积分得到的矩阵。
定义 | 解释 |
---|---|
矩阵函数 | 首先是一种函数,特殊之处在于:函数的自变量是矩阵,因变量也是矩阵 |
函数矩阵 | 首先是一种矩阵,特殊之处在于:矩阵中每一元素都关于自变量t的函数
a i j ( t ) a_{ij}(t) aij(t) |
4.3 函数对矩阵的导数
4.4 函数矩阵对矩阵的导数
函数矩阵的导数 -定义 | 解释 |
---|---|
函数对矩阵的导数 | 首先有一个矩阵X,再有一个mn元的函数
f ( X ) f(X) f(X),其特点是:自变量是X中每一元素。求的是 f ( X ) d X \frac{f(X)}{dX} dXf(X)。 |
函数矩阵对矩阵的导数 | 首先有一个函数矩阵F(X),其特点是:每一元素都是一种函数
f ( X ) i j f(X)_{ij} f(X)ij。其中, f ( X ) i j d X \frac{f(X)_{ij}}{dX} dXf(X)ij即是上面“函数对矩阵的导数” |