我们继续消去法,看看它对矩阵意味着什么。我们从
Ax=b
开始:
Ax=⎡⎣⎢24−21−67102⎤⎦⎥⎡⎣⎢uvw⎤⎦⎥=⎡⎣⎢5−29⎤⎦⎥=b(1)
然后有三个消去步骤,乘数分别为
2,−1,−1
:
Step 1. 第二个方程减去第一个方程的2倍;
Step 2. 第三个方程减去第一个方程的-1倍;
Step 3. 第三个方程减去第二个方程的-1倍;
这个结果等价于
Ux=c
,其中
U
是一个新系数矩阵:
矩阵
U
是上三角矩阵,主对角线下面的元素都为零。
对于原始向量
A
变为
c
,前向消元一共执行了三个行操作:
- 开始是
A 和
b
; - 一次应用步骤1,2,3;
- 最后是
U 和
c
。
然后用回代求解
A
和
第一步的矩阵
E
,第二步的矩阵
G
之前已经介绍了。他们都叫做初等矩阵,很容易看出他们是如何得出的。方程
j
的
−ℓ
放到
(i,j)
的位置,其他地方跟单位矩阵保持一致,即对角线上为1其他地方为0,这样矩阵乘法就执行了行操作。
三次操作的结果是
GFEA=U
,注意
E
首先乘以
F
,最后是
GFE
乘在以前得到一个下三角矩阵(0省略掉了):
GFE=⎡⎣⎢1111⎤⎦⎥⎡⎣⎢1111⎤⎦⎥⎡⎣⎢1−211⎤⎦⎥=⎡⎣⎢1−2−1111⎤⎦⎥(3)
但是最重要的问题是反过来的:我们怎样从
U
回到
撤销第一步不难,不用减法而是用第二行加上第一行的二倍。做一次加法和一次减法最后回到了单位矩阵:
⎡⎣⎢120010001⎤⎦⎥⎡⎣⎢1−20010001⎤⎦⎥=⎡⎣⎢100010001⎤⎦⎥(4)
一个操作取消了另一个操作。用矩阵的语言来描述就是:一个矩阵是另一个矩阵的逆。如果初等矩阵
E
在
−ℓ
,那么它的逆在同样的位置处为
ℓ
。所以
E−1E=I
,也就是等式(4)。
我们可以用
E−1,F−1,G−1
将消元的每步都取逆。最终的问题就是一次撤销整个操作,知道什么矩阵将
U
回到
因为从
A
到
G
肯定是第一个取逆的。和正向的顺序正好相反!第二个取逆步骤是
E−1
:
E−1F−1G−1U=A is LU=A(5)
现在我们将
U
变为
L
,因为它是下三角矩阵。通过将他们按顺序乘起来就能看出这个性质:
对角线下面的元素分别是
ℓ=2,−1,−1
。当矩阵相乘时,通常无法直接给出答案。但这里比较特殊直接按从左到右的顺序立马写出来。如果计算机存储每个乘数
ℓij
(也就是第
i
行减去第
i,j
的位置得到零,那么这些乘数就记录了消元法。
8、没有行交换的三角分解
A=LU
。
L
是下三角矩阵,其中对角线元素为1,下面的元素为
U
是上三角矩阵,它的对角线元素是主元。
例1:
从
A
到
U
到
例2:当
U
是单位矩阵时,
A
相等
在
A
上的消元步骤很容易:
ℓ21
倍,
(ii)
第三行减去第一行的
ℓ31
倍,
(iii)
第三行减去第二行的
ℓ32
倍。结果是单位矩阵
U=I
。将他们的逆相乘即可得到
A
:
三角分解
A=LU
非常重要,所以我在多说一点。以前在线性代数中不讲这些知识,或许是因为它太难(但是相信大家已经掌握了)。如果例2中的
U
是任何一个矩阵而不是单位矩阵
A=LU⎡⎣⎢1ℓ21ℓ3101ℓ32001⎤⎦⎥⎡⎣⎢row 1 of Urow 2 of Urow 3 of U⎤⎦⎥=A(7)
它的证明就是利用消元步骤,右边将
A
变为
L
变为
U
,这些步骤都是双效的,所有(7)是正确的即
A=LU
非常重要,形式也很美。我们目前用的是
3×3
矩阵,但是对于更大的矩阵它也适用。这里我们给出一个例子
例3:
A=⎡⎣⎢⎢⎢1−1−12−1−12−1−12⎤⎦⎥⎥⎥=⎡⎣⎢⎢⎢1−11−11−11⎤⎦⎥⎥⎥⎡⎣⎢⎢⎢1−11−11−11⎤⎦⎥⎥⎥
A
有三条对角线,
一个线性系统=两个三角系统
A=LU
有一个很实际的应用,它不仅记录了消元法的步骤;
L,U
也是求解
Ax=b
的矩阵。事实上
A
可以被抛弃了!通过前向消元(利用
b
变成
U
)可以将
x
:
用
L
乘以第二个方程得
Ax=b
。每一个三角系统可以很快的求解出来,这样我们的消元法就变为:
- 分解(从
A
中求出因子L,U ) - 求解(从
L,U,b
中求出解
x
)
求解子过程满足方程(8):两个三角方程每个需要
b
,我们只需要
n3/3
。
例4:考虑上个例子中的矩阵,右边的
b=(1,1,1,1)
Ax=bx1−x1−+−x22x2x2−+−x32x3x3−+x42x4====1111分解成Lc=b,Ux=cLc=bc1−c1+−c2c2+−c3c3+c4====1111求出c=⎡⎣⎢⎢⎢1234⎤⎦⎥⎥⎥Ux=cx1−x2x2−x3x3−x4x4====1234求出x=⎡⎣⎢⎢⎢10974⎤⎦⎥⎥⎥
对于这些特殊的三角矩阵,操作步骤由
n2
变为
2n
。可以清楚的看到
Lc=b
通过前向步骤求解出来
c
(
c2
之前),而
Ux=c
通过回代过程求解出来
x
(
x3
之前)。
注解1:
LU
关于在对角线上是不对称的:
L
是1而
D
即可:
上面的例子中主元为1,所以
D=I
。但是这只是个特例,一般情况下
LU
和
LDU
(也写成
LDV
)是不相同的。
当看到
LDU,LDV
时,可以将
U,V
理解为每行是除以主元得到的。举例说明
A=[1324]=[131][12−2]=[131][1−2][121]=LDU
L,U
的对角线上都是1,
D
的对角线上是主元1和-2。
注解2:我们已经给出了每个消元步骤的表达式,其中计算必须按顺序进行。对于这一点不全对,有一种克劳特算法计算方法跟他有点不同,在顺序上稍微自由一下。但是最终结果
9、如果
A=L1D1U1,A=L2D2U2
,其中
L
是下三角矩阵,
D
是对角矩阵且对角线上没有零元素,那么
LDU
分解和
LU
分解由
A
唯一确定。
这个证明需要用到逆矩阵,等学到时再给出详细证明。
行交换和置换矩阵
我们现在必须面对无法避免的问题:主元可能是零。这种情况可能发生在中间的计算过程中,如果
[0324][uv]=[b1b2]
明显这种情况比较麻烦,我们无法利用第一个方程消去系数3。
但是修正也比较明显,交换两个方程,将元素3上移变为主元。对于这个例子矩阵将变成上三角矩阵:
3u+4v2v==b2b1
为了用矩阵形式表示,我们需要置换矩阵
P
来产生行交换,通过对单位矩阵
P=[0110]PA=[0110][0324]=[3042]
对于
b
,
b1,b2
。新的系统就变为
PAx=Pb
,行交换中未知量
u,v
没有改变顺序。
置换矩阵
P
和单位矩阵有相同的行,每行每列都有1。最普通的置换矩阵是单位矩阵
如果
P=I
,那么最简单的置换就是只交换两行,其他的置换交换更多。对于大小为
n
的矩阵存在
n
种选择,那么第二行有
3×3
置换矩阵(有
3!=(3)(2)(1)=6
个矩阵):
I=⎡⎣⎢111⎤⎦⎥P31=⎡⎣⎢111⎤⎦⎥P21=⎡⎣⎢111⎤⎦⎥P32=⎡⎣⎢111⎤⎦⎥P32P21=⎡⎣⎢111⎤⎦⎥P21P32=⎡⎣⎢111⎤⎦⎥
如果
n=4
,将会有24种置换矩阵,如果
n=2
那么只有两种置换矩阵,即
[1001][0110]
如果我们知道逆和转置(之后将他们定义为
A−1
和
AT
),那么我们将发现一个重要的事实:
P−1
总是等于
PT
。
主元位置上是零会产生两种可能:这个问题可能很容易修改,或者比较麻烦。这完全取决于零元素,如果一列下方有非零元素,那么就能执行行交换,将非零元素变成主元然后就能继续消元过程:
A=⎡⎣⎢00da0ebcf⎤⎦⎥d=0⇒没有第一主元a=0⇒没有第二主元c=0⇒没有第三主元
如果
d=0
,那么这个问题将无法解决,矩阵就是奇异的,对
Ax=b
不存在唯一解。如果
d
不是零,那么通过交换1,3行可以将
a
,如果
P23
进行行交换:
P13=⎡⎣⎢001010100⎤⎦⎥P23=⎡⎣⎢100001010⎤⎦⎥P23P13A=⎡⎣⎢d00ea0fbc⎤⎦⎥
还有一点是:置换矩阵
P23P13
可以执行一次行交换:
P23P13A=⎡⎣⎢100001010⎤⎦⎥⎡⎣⎢001010100⎤⎦⎥=⎡⎣⎢010001100⎤⎦⎥=P
这样的话我们就直接用
P
乘以
消元法:
PA=LU
主要的观点是这样的:如果在行交换的帮助下可以完成消元,那么我们可以首先用
P
来完成这个步骤。矩阵
PA
可以分解成标准的
L,U
。高斯消元理论可以概括为下面几行:
10、对于奇异的情况,存在一个置换矩阵,它重排矩阵
A
的行来避免主元位置出现零,然后
提前进行行排序,
PA
可以分解成
LU
。
如果不存在
P
使得产生所有主元集合,那么消元法将失效。
实际中,当原始主元接近零时,我们也考虑行交换,选择一个更大的主元是为了减小舍入误差。
仔细留意一下
ℓ21=1
,然后2,3行进行交换。或者如果提前进行交换,那么乘因子就变为
ℓ31=1
。
例5:
A=⎡⎣⎢112115138⎤⎦⎥→⎡⎣⎢100103136⎤⎦⎥→⎡⎣⎢100130162⎤⎦⎥=U(10)
然后利用行交换来恢复
LU
,但是此时
ℓ31=1,ℓ21=2
:
P=⎡⎣⎢100001010⎤⎦⎥⎡⎣⎢121010001⎤⎦⎥PA=LU(11)