贝叶斯滤波

1. 概率基础回顾

条件概率：

(

∣

)

(

)

(

)

(

)

(

∣

)

(

)

(

∣

)

(

)

p(x|y)=p(x,y)/p(y) \\ \ \\ p(x,y)=p(x|y)p(y)=p(y|x)p(x)

$p (x ∣ y) = p (x, y) / p (y) p (x, y) = p (x ∣ y) p (y) = p (y ∣ x) p (x)$

全概率公式：

(

)

∑

(

)

∑

(

∣

)

(

)

p(x) = \sum\limits_y {p(x,y)}=\sum\limits_y {p(x|y)p(y)}

$p (x) = y \sum p (x, y) = y \sum p (x ∣ y) p (y)$

全概率公式的意义在于，当某一事件的概率难以求得时，可转化为在一系列条件下发生概率的和。

2. 贝叶斯公式

2.1 贝叶斯公式

基于条件概率公式和全概率公式，我们可以导出贝叶斯公式：

$$

\begin{array}{c} P(x,y) = P(x|y)P(y) = P(y|x)P(x)\

\Rightarrow \

\end{array}

$$

(

∣

)

(

∣

)

(

)

(

)

(

∣

)

(

)

∑

(

∣

)

(

)

P(x\,\left| {\,y} \right.) = \frac{

{P(y|x)\,\,P(x)}}{

{P(y)}} = \frac {

{P(y|x)\,\,P(x)}} {

{ \sum\limits_y {p(x|y)p(y)} }}

$P (x ∣ y) = \frac{P ( y ∣ x ) P ( x )}{P ( y )} = \frac{P ( y ∣ x ) P ( x )}{y \sum p ( x ∣ y ) p ( y )}$

这里x是某种状态，y 是某种预观测。下面例子中 x 代表门开关，y 代表距离z
我们称P(y|x)为

causal knowledge（因果知识）

，意即由x的已知情况，就可以推算y发生的概率，例如在图2的例子中，已知如果门开着，则z=0.5m的概率为0.6；如果门关着，则z=0.5m的的概率为0.3。
P(x) 为

prior knowledge

，先验概率。可以设开关概率都是 0.5。
P(x|y) 是基于观测对状态的诊断或推断。

贝叶斯公式的本质就是利用causal knowledge和prior knowledge来进行状态推断或推理

2.2 贝叶斯公式的计算

可以把分母项看成归一化系数

\eta

$η$

(

∣

)

(

∣

)

(

)

(

)

(

∣

)

(

)

(

)

−

∑

(

∣

)

(

)

\begin{array}{l} P(x\,\left| {\,y} \right.) = \frac{

{P(y|x)\,\,P(x)}}{

{P(y)}} = \eta \;P(y|x)\,P(x)\\ \eta = P{(y)^{ – 1}} = \frac{1}{

{\sum\limits_x {P(y|x)} P(x)}} \end{array}

$P (x ∣ y) = \frac{P ( y ∣ x ) P ( x )}{P ( y )} = η P (y ∣ x) P (x) η = P (y)^{- 1} = \frac{1}{x \sum P ( y ∣ x ) P ( x )}$

Algorithm:

∣

(

∣

)

(

)

∑

∣

∀

(

∣

)

∣

\begin{array}{l} \forall x:{\rm{au}}{

{\rm{x}}_{x|y}} = P(y|x)\,\,P(x)\\ \eta = \frac{1}{

{\sum\limits_x {

{\rm{au}}{

{\rm{x}}_{x|y}}} }}\\ \forall x:P(x|y) = \eta \;{\rm{au}}{

{\rm{x}}_{x|y}} \end{array}

$\forall x : a u x_{x ∣ y} = P (y ∣ x) P (x) η = \frac{1}{x \sum a u x _{x ∣ y}} \forall x : P (x ∣ y) = η a u x_{x ∣ y}$

2.3 贝叶斯公式融合多种观测

(

∣

)

(

)

(

)

(

∣

)

(

)

(

)

(

∣

)

(

∣

)

(

)

(

∣

)

(

)

(

∣

)

(

∣

)

(

∣

)

\begin{array}{l} P(x|y,z){\rm{ = }}\frac{

{P(x,y,z)}}{

{P(y,z)}}\\ = \frac{

{P(y|x,z)p(x,z)}}{

{P(y,z)}}\\ = \frac{

{P(y|x,z)p(x|z)p(z)}}{

{P(y|z)p(z)}}\\ = \frac{

{P(y|x,z)p(x|z)}}{

{P(y|z)}} \end{array}

$P (x ∣ y, z) = \frac{P ( x , y , z )}{P ( y , z )} = \frac{P ( y ∣ x , z ) p ( x , z )}{P ( y , z )} = \frac{P ( y ∣ x , z ) p ( x ∣ z ) p ( z )}{P ( y ∣ z ) p ( z )} = \frac{P ( y ∣ x , z ) p ( x ∣ z )}{P ( y ∣ z )}$

所以，在预观测 y, z 条件下 x 发生的概率：

(

∣

)

(

∣

)

(

∣

)

(

∣

)

P(x|y,z) = \frac{

{P(y|x,z)\,\,P(x|z)}}{

{P(y|z)}}

$P (x ∣ y, z) = \frac{P ( y ∣ x , z ) P ( x ∣ z )}{P ( y ∣ z )}$

2.4 贝叶斯递推公式

由此，我们来推导贝叶斯滤波的递推公式：

(

∣

…

)

P(x|z_1, \ldots ,z_n) =?

$P (x ∣ z_{1}, \dots, z_{n}) = ?$

再由Markov属性，在x已知的情况下，

z_n

$z_{n}$

同

−

…

}

\{ z_{n-1}, \ldots, z_1 \}

${z_{n - 1}, \dots, z_{1}}$

无关

(

∣

…

)

(

∣

…

–

)

(

∣

…

–

)

(

∣

…

–

)

(

∣

)

(

∣

…

–

)

(

∣

…

–

)

\begin{array}{c} P(x|z_1, \ldots ,z_n) = \frac{

{P(z_n|x,z_1, \ldots ,z_{n – 1})\;P(x|z1, \ldots ,z_{n – 1})}}{

{P(z_n|z_1, \ldots ,z_{n – 1})}}\\ =\frac{

{P(z_n|x)\;P(x|z1, \ldots ,z_{n – 1})}}{

{P(z_n|z_1, \ldots ,z_{n – 1})}} \end{array}

$P (x ∣ z_{1}, \dots, z_{n}) = \frac{P ( z _{n} ∣ x , z _{1} , \dots , z _{n - 1} ) P ( x ∣ z 1 , \dots , z _{n - 1} )}{P ( z _{n} ∣ z _{1} , \dots , z _{n - 1} )} = \frac{P ( z _{n} ∣ x ) P ( x ∣ z 1 , \dots , z _{n - 1} )}{P ( z _{n} ∣ z _{1} , \dots , z _{n - 1} )}$

所以：

$$

\begin{array}{*{20}{l}}

{P(x|{z_1}, \ldots ,{z_n})}&{ = \frac{

{P({z_n}|x);P(x|{z_1}, \ldots ,{z_{n{\rm{ – }}1}})}}{

{P({z_n}|{z_1}, \ldots ,{z_{n – 1}})}}}\ {}&{ = {\eta

n};P({z_n}|x);P(x|{z_1}, \ldots ,{z

{n – 1}})}\

{}&\begin{array}{l} = {\eta

n};P({z_n}|x);{\eta

{n – 1}}P({z

{n – 1}}|x)P(x|{z_1}, \ldots ,{z

{n – 2}})\ = {\eta _1} \cdots {\eta

n};\prod\limits

{i = 1…n} {P({z_i}|x)} ;P(x)

\end{array}

\end{array}

$$

3. 如何融入动作

在实际问题中，对象总是处在一个动态变化的环境中，例如：

机器人自身的动作影响了环境状态
其它对象，比如人的动作影响了环境状态
或者就是简单的环境状态随着时间发生了变化。

如何在Bayes模型中来描述动作的影响呢?

首先，动作所带来的影响也总是具有不确定性的
其次，相比于观测，动作一般会使得对象的状态更为模糊（或更不确定）。

我们用u来描述动作，在 x’ 状态下，执行动作 u 后，对象状态变成 x 的概率为：

(

∣

’

)

P(x|u,x’)

$P (x ∣ u, x ’)$

动作对状态的影响一般由状态转移模型来描述。如图3所示，表示了“关门”这个动作对状态影响的转移模型。这个状态转移模型表示：关门这个动作有0.1的失败概率，所以当门是open状态时，执行“关门”动作，门有0.9的概率转为closed状态，有0.1的概率保持在open状态。门是closed的状态下，执行“关门”动作，门仍然是关着的。

执行某一动作后，计算动作后的状态概率，需要考虑动作之前的各种状态情况，把所有情况用全概率公式计算：

连续情况下

(

x

∣

u

)

=

∫

P

(

x

∣

u

,

x

′

)

P

(

x

′

)

d

x

′

P(x|u) = \int {P(x|u,x’)P(x’)dx’}

$P (x ∣ u) = \int P (x ∣ u, x^{'}) P (x^{'}) d x^{'}$
离散情况下

(

x

∣

u

)

=

∑

P

(

x

∣

u

,

x

′

)

P

(

x

′

)

P(x|u) = \sum {P(x|u,x’)P(x’)}

$P (x ∣ u) = \sum P (x ∣ u, x^{'}) P (x^{'})$

例3：
Dog face
在例2的基础上，如果按照图3所示的状态转移关系，机器人执行了一次关门动作，计算动作后门开着的概率？

(

∣

)

∑

(

∣

′

)

(

′

)

(

∣

)

(

)

(

∣

)

(

)

∗

0.8

∗

0.2

0.08

\begin{array}{lllll} P(open|u) & = \sum {P(open|u,x’)P(x’)} \\ & \,\, = P(open|u,open)P(open)\\ & \quad + P(open|u,closed)P(closed)\\ & {\kern 1pt} \; = \frac{1}{

{10}} * 0.8 + \frac{0}{1} * 0.2 = 0.08\\ \end{array}

$P (o p e n ∣ u) = \sum P (o p e n ∣ u, x^{'}) P (x^{'}) = P (o p e n ∣ u, o p e n) P (o p e n) + P (o p e n ∣ u, c l o s e d) P (c l o s e d) = \frac{1}{1 0} * 0.8 + \frac{0}{1} * 0.2 = 0.08$

(

∣

)

∑

(

∣

′

)

(

′

)

(

∣

)

(

)

(

∣

)

(

)

∗

0.8

∗

0.2

0.92

\begin{array}{lllll} P(closed|u) & = \sum {P(closed|u,x’)P(x’)} \\ & \,\, = P(closed|u,open)P(open)\\ & \quad + P(closed|u,closed)P(closed)\\ & {\kern 1pt} \; = \frac{9}{

{10}} * 0.8 + \frac{1}{1} * 0.2 = 0.92 \end{array}

$P (c l o s e d ∣ u) = \sum P (c l o s e d ∣ u, x^{'}) P (x^{'}) = P (c l o s e d ∣ u, o p e n) P (o p e n) + P (c l o s e d ∣ u, c l o s e d) P (c l o s e d) = \frac{9}{1 0} * 0.8 + \frac{1}{1} * 0.2 = 0.92$

所以门还开着的概率为 0.08 。