《矩阵论》学习笔记(三):第三章 矩阵分析及其应用
本章讲述矩阵分析的理论,其基础是高等数学分析。所有的定义、性质都是从从高等数学分析中引申出来的。
一、矩阵序列
1.1 什么是矩阵序列
- 
1-矩阵序列提出的原因: 
 矩阵序列是对数列的推广。
- 
2-矩阵序列的研究重点? 
 研究重点:常常研究的是矩阵序列的收敛问题。
 解决方式:借助矩阵范数,将矩阵序列的收敛性问题→ \to →正项数列的收敛性问题。 
- 
3-什么是矩阵序列? 
1.2 矩阵序列的收敛
- 
1-矩阵序列收敛/发散的定义 
 [矩阵序列的收敛等价于多个数列收敛]
- 
2-矩阵序列收敛的性质: 
 满足加法/乘法/逆的性质。
- 
3-矩阵序列收敛的判断: 
 思路:借助矩阵范数,将矩阵序列的收敛性问题→ \to →正项数列的收敛性问题。 
设
A
∈
C
m
∗
n
A∈C^{m*n}
A∈Cm∗n,则有:
A
(
k
)
→
O
A^{(k)} \to O
A(k)→O的充要条件是:
∣
∣
A
(
k
)
∣
∣
→
0
||A^{(k)}|| \to 0
∣∣A(k)∣∣→0.
A
(
k
)
→
A
A^{(k)} \to A
A(k)→A的充要条件是:
∣
∣
A
(
k
)
−
A
∣
∣
→
0
||A^{(k)}-A|| \to 0
∣∣A(k)−A∣∣→0.
1.3 矩阵序列的有界
1.4 收敛矩阵的定义与性质
- 1-什么是收敛矩阵?
 [前提A是方阵n*n]
- 2-收敛矩阵的判断:
- A为收敛矩阵的充要条件:
ρ
(
A
)
<
1
\rho(A)<1
ρ(A)<1.
- A为收敛矩阵的充分条件:只要存在一种矩阵范数||.||,使得
∣
∣
A
∣
∣
<
1
||A||<1
∣∣A∣∣<1.
[根据矩阵谱半径的性质推出]
二、矩阵级数
2.1 什么是矩阵级数
- 
1-矩阵级数提出的原因: 
 矩阵级数是对常数项级数概念的推广。
 数学分析中的级数(幂级数)理论占有很重要的位置。所以要讨论矩阵级数。
- 
2-矩阵级数的研究重点? 
 研究重点:矩阵级数的收敛问题、幂级数。
 解决方式:借助矩阵范数,将矩阵级数的绝对收敛性问题→ \to →正项级数的收敛性问题。 
- 
3-什么是矩阵级数? 
∑
k
=
0
无
穷
A
(
k
)
\sum_{k=0}^{无穷}A^{(k)}
∑k=0无穷A(k):矩阵序列形成的无穷项和。
2.2 矩阵级数的收敛性
- 
1-矩阵级数的部分和 S ( k ) S^{(k)} S(k) 
- 
2-什么是矩阵级数的收敛? 
 [矩阵级数的收敛等价于多个常数项级数收敛]
2.3 矩阵级数的绝对收敛
- 1-什么是矩阵级数的绝对收敛?
 [矩阵级数的绝对收敛等价于多个常数项级数绝对收敛]
- 2-矩阵级数绝对收敛的性质
| ∑ k = 0 无 穷 A ( k ) \sum_{k=0}^{无穷}A^{(k)} ∑k=0无穷A(k) | 矩阵级数绝对收敛的性质 | 
|---|---|
| 性质1 | 绝对收敛级数的更序级数绝对收敛. | 
| 性质2 | 矩阵级数绝对收敛的充要条件:正项级数收敛. | 
| 性质3 | 矩阵级数收敛/绝对收敛,其则矩阵 ∑ P A ( k ) Q \sum PA^{(k)}Q ∑PA(k)Q也收敛/绝对收敛. | 
| 性质4 | 两矩阵级数绝对收敛,其按项相乘矩阵也绝对收敛. | 
2.4 幂级数
- 
1-什么是矩阵的幂级数? 
 [矩阵是方阵]
- 
2-幂级数与矩阵幂级数的关系: 
已知幂级数的收敛半径r,则:
若方阵A满足ρ
(
A
)
<
r
\rho(A)<r
ρ(A)<r,则矩阵幂级数收敛;
若方阵A满足ρ
(
A
)
>
r
\rho(A)>r
ρ(A)>r,则矩阵幂级数发散;
若方阵A满足ρ
(
A
)
=
r
\rho(A)=r
ρ(A)=r,矩阵幂级数收敛性不确定.
- 3-矩阵幂级数收敛的判断:
- 方阵A的幂级数收敛的充要条件:
A为收敛矩阵,且收敛时,其和为(
I
−
A
)
−
1
(I-A)^{-1}
(I−A)−1.
[A为收敛矩阵,则要满足ρ
(
A
)
<
1
\rho(A)<1
ρ(A)<1].
- 借助
ρ
(
A
)
与
r
、
ρ
(
A
)
与
范
数
∣
∣
A
∣
∣
\rho(A)与r、\rho(A)与范数||A||
ρ(A)与r、ρ(A)与范数∣∣A∣∣的关系判断,
ρ
(
A
)
<
r
、
ρ
(
A
)
<
∣
∣
A
∣
∣
\rho(A)<r、\rho(A)<||A||
ρ(A)<r、ρ(A)<∣∣A∣∣.
[方阵幂级数的绝对收敛转换为复变量幂级数的绝对收敛].
三、矩阵函数
3.1 矩阵函数的定义
- 1-矩阵函数提出的原因:
 矩阵函数是对一元函数概念的推广。
 矩阵函数以矩阵为自变量且取值也是矩阵的一类函数。
 矩阵函数的基础是矩阵序列和矩阵级数。
- 2-矩阵函数的定义?
 矩阵函数是由一个收敛的矩阵幂级数的和定义的。
 矩阵函数存在的条件:
 1)A是方阵;
 2)是矩阵幂级数的和;
 3)ρ ( A ) < r \rho(A)<r 
 ρ(A)<r.
3.2 常见的矩阵函数与性质
- 常见的矩阵函数:
| 复平面 C n ∗ n C^{n*n} Cn∗n | 矩阵幂级数 A ∈ C n ∗ n A∈C^{n*n} A∈Cn∗n | 
|---|---|
| 指数函数 e z e^z ez | 矩阵指数函数 e A e^A eA | 
| 三角函数 c o s z cosz cosz | 矩阵三角函数 c o s A cosA cosA | 
| 三角函数 s i n z sinz sinz | 矩阵三角函数 s i n A sinA sinA | 
- 常见矩阵函数的运算性质
- 指数运算:
 e A e B ≠ e B e A ≠ e A + B e^Ae^B≠e^Be^A≠e^{A+B} 
 eAeB=eBeA=eA+B.
 而是:若A B = B A AB=BA 
 AB=BA,则e A e B = e B e A = e A + B e^Ae^B=e^Be^A=e^{A+B} 
 eAeB=eBeA=eA+B.
 ->e A e − A = e − A e A = e I e^Ae^{-A}=e^{-A}e^A=e^I 
 eAe−A=e−AeA=eI
 ->( e A ) − 1 = e − A (e^A)^{-1}=e^{-A} 
 (eA)−1=e−A
- 三角函数运算:
 若A B = B A AB=BA 
 AB=BA,则:
 c o s ( A + B ) = c o s A c o s B − s i n A s i n B cos(A+B)=cosAcosB-sinAsinB 
 cos(A+B)=cosAcosB−sinAsinB
 c o s 2 A = c o s 2 A − s i n 2 A cos2A=cos^2A-sin^2A 
 cos2A=cos2A−sin2A
 s i n ( A + B ) = s i n A c o s B + s i n B c o s A sin(A+B)=sinAcosB+sinBcosA 
 sin(A+B)=sinAcosB+sinBcosA
 s i n 2 A = 2 s i n A c o s A sin2A=2sinAcosA 
 sin2A=2sinAcosA
3.3 矩阵函数值的求法
3.3.1 待定系数法
| 待定系数法求解步骤: | |
|---|---|
| 1. 将矩阵A的特征多项式表达成特征值的因式 | φ ( λ ) = d e t ( λ I − A ) = ∏ i = 1 s ( λ − x i ) r i \varphi(\lambda)=det(\lambda I-A)=\prod_{i=1}^s(\lambda-x_i)^{ri} φ(λ)=det(λI−A)=∏i=1s(λ−xi)ri | 
| 2. 写出首1多项式. ψ ( λ ) \psi(\lambda) ψ(λ) | 满足: 1) ψ ( λ ) = O \psi(\lambda)=O ψ(λ)=O; 2) ψ ( λ ) \psi(\lambda) ψ(λ)可以整除 φ ( λ ) . \varphi(\lambda). φ(λ). | 
| 3. 用首1多项式表示函数 f ( z ) f(z) f(z) | f ( z ) = ψ ( λ ) g ( z ) + r ( z ) f(z)=\psi(\lambda)g(z)+r(z) f(z)=ψ(λ)g(z)+r(z) | 
| 4. 计算 r ( z ) → r ( A ) r(z) \to r(A) r(z)→r(A) | f ( A ) = r ( A ) f(A)=r(A) f(A)=r(A) | 
3.3.2 数项级数求和法
3.3.3 对角形法
当A相似于一个对角矩阵B时,可以将矩阵幂级数求和问题转化成求其相似变换矩阵的问题。
 
A
=
P
B
P
−
1
A=PBP^{-1}
A=PBP−1,
A
2
=
P
B
2
P
−
1
A^2=PB^2P^{-1}
A2=PB2P−1
f
(
A
)
=
∑
k
=
0
无
穷
c
k
A
k
=
P
[
.
.
.
]
P
−
1
f(A)=\sum_{k=0}^{无穷}c_kA^k=P[…]P^{-1}
    f(A)=∑k=0无穷ckAk=P[...]P−1
 注意:这里的P矩阵不唯一,但结果却总是相同的。
3.3.4 Jordan标准形法
矩阵幂级数求和问题可以转化成求矩阵的Jordan标准形及相似变换矩阵的问题。
3.4 矩阵函数的另一种定义
- 1-矩阵函数另一种定义提出的原因:
 3.1中对矩阵的定义限制必须能够写成矩阵幂级数f ( A ) = ∑ c k A f(A)=\sum c_kA 
 f(A)=∑ckA的形式。
 而对于任意的函数,不一定能展开成幂级数的形式。所以需要拓宽矩阵函数的定义。
- 2-矩阵函数的定义?
 任意矩阵都相似于一个Jordan标准形矩阵。用Jordan标准形矩阵来定义矩阵函数f ( A ) f(A) 
 f(A).
 要求:函数f ( z ) f(z) 
 f(z)在λ i \lambda_i 
 λi处具有m i − 1 m_i-1 
 mi−1阶的导数。
四、矩阵的微分与积分
4.1 什么是函数矩阵?
对
A
(
t
)
=
(
a
i
j
(
t
)
)
m
∗
n
A(t)=(a_{ij}(t))_{m*n}
    A(t)=(aij(t))m∗n,
 其中,矩阵A中每个元素
a
i
j
(
t
)
a_{ij}(t)
aij(t)都是t的函数,这样的矩阵称作函数矩阵。
4.2 函数矩阵的导数与积分
- 
函数矩阵的导数: 
 矩阵函数的导数值等于对矩阵中每个元素求导得到的矩阵。
- 
函数矩阵的积分: 
 矩阵函数的积分值等于对矩阵中每个元素积分得到的矩阵。
| 定义 | 解释 | 
|---|---|
| 矩阵函数 | 首先是一种函数,特殊之处在于:函数的自变量是矩阵,因变量也是矩阵 | 
| 函数矩阵 | 首先是一种矩阵,特殊之处在于:矩阵中每一元素都关于自变量t的函数 a i j ( t ) a_{ij}(t) aij(t) | 
4.3 函数对矩阵的导数
4.4 函数矩阵对矩阵的导数
| 函数矩阵的导数 -定义 | 解释 | 
|---|---|
| 函数对矩阵的导数 | 首先有一个矩阵X,再有一个mn元的函数 f ( X ) f(X) f(X),其特点是:自变量是X中每一元素。求的是 f ( X ) d X \frac{f(X)}{dX} dXf(X)。 | 
| 函数矩阵对矩阵的导数 | 首先有一个函数矩阵F(X),其特点是:每一元素都是一种函数 f ( X ) i j f(X)_{ij} f(X)ij。其中, f ( X ) i j d X \frac{f(X)_{ij}}{dX} dXf(X)ij即是上面“函数对矩阵的导数” | 
