∮1.随机样本
-
总体
:某项数量指标X的全体 -
样本
:如果
x
1
,
x
2
,
x
3
,
⋯
,
x
n
,
相互独立且与总体X同分布则称
x
1
,
x
2
,
x
3
,
⋯
,
x
n
,
为来自总体的简单随机样本。
∮3抽样分布
统计量
是统计理论中用来对数据进行分析、检验的变量。宏观量是大量微观量的统计平均值,具有统计平均的意义,对于单个微观粒子,宏观量是没有意义的.相对于微观量的统计平均性质的宏观量也叫统计量.需要指出的是,描写宏观世界的物理量例如速度、动能等实际上也可以说是宏观量,但宏观量并不都具有统计平均的性质,因而宏观量并不都是统计量.数理统计的基本概念。指不含未知参数的样本函数。如样本x1,x2,…,xn的算术平均数(样本均值)=1n(x1+x2+…+xn)就是一个统计量。从样本构造统计量,实际上是对样本所含总体的信息提炼加工;根据不同的推断要求,可以构造不同的统计量。
在抽样分布提到了一个观察值的概念这个概念,我所理解的是:它是由统计量函数应用到实际的“微观”概念。
样本均值、样本方差、样本标准差、样本k阶矩,样本k阶中心矩,
为什么样本方差(sample variance)的分母是 n-1?
经验分布函数:
对于经验函数有一个已被证明的结论,当样本数趋近于无穷时,经验函数以概率1一致的收敛于分布函数F(x);
χ
2
分
布
χ
2
分
布
的
性
质
:
由Γ分布的可加性易得,
1.
χ
2
的可加性:
χ
2
1
~
χ
2
,
χ
2
2
~
χ
2
,并且
χ
2
1
,
χ
2
2
相互独立则有:
χ
2
1
+
χ
2
2
~
χ
2
(
n
1
+
n
2
)
2.
χ
2
的期望和方差:
E
(
χ
2
)
=
n
,
D
(
χ
2
)
=
2
n
3.
χ
2
的上分位点:
对于给定α,0<α<1满足条件:
P
{
χ
2
>
χ
2
a
(
n
)
}
=
∫
∞
χ
2
a
(
n
)
f
(
y
)
d
y
=
α
对于样本数充分大的时候,近似有
χ
2
a
(
n
)
≈
1
2
(
z
α
+
2
n
−
1
−
−
−
−
−
√
)
2
其中
z
α
是正态分布上α的分位点。
z
α
=
Φ
−
1
(
1
−
α
)
other
由于卡方分布的前提是正太分布,因此卡方分布中关于分位点的计算一定涉及到非正太分布到正太分布的转换,如下:
t分布
定义:
设
X
服从标准正态分布
N
(
0
,
1
)
,
Y
服从自由度为n的
χ
2
分布,且
X
1
,
X
2
相互独立,则称变量
t
=
X
Y
n
−
−
√
所服从的分布为自由度为n的t分布。
图像:
期望:
E(T)=0
方差:
D(T)=n/(n-2),n>2
##other
t分布很有意思,因为当n很大时,t分布类似于标准正态分布的图形,也就是说对概率密度取n的极限时,
(
1
+
x
2
n
)
−
(
n
+
1
)
2
为
1
∞
所以其和
e
−
t
2
2
等价,所以概率密度左侧等价于
1
2
π
√
F分布
定义
设U服从自由度为
n
1
的
χ
2
分布,V服从自由度为
n
2
的
χ
2
分布,且U,V相互独立,则称变量
F
=
U
/
n
1
V
/
n
2
所服从的分布为F分布,其中第一自由度为
n
1
,第二自由度为
n
2
.
图像
性质
- 期望E(F)=n/(n-2),方差D(F)=2n^2(m+n-2)/m(n-2)^2(n-4)
- 若F~F(m,n),则1/F~F(n,m)
- 若F~F(1,n),T~T(n),则F=T^2
正太总体的样本均值与样本方差的分布
在这一节,先证明了样本均值的期望与样本均值方差与正太总体样本均值的异同:
E
(
x
)
=
μ
,
D
(
x
)
=
σ
2
n
-
当样本均值的方差仅为总体方差的
1
n
- 当样本容量增大时,样本均值的方差远小于总体的方差。
-
样本均值的期望与总体方差大小相等
概率密度为偶函数的数学期望必为0.
然后由,正态分布的可加性可知,
定理一
若
x
0
,
x
1
,
x
2
,
x
2
,
x
2
,
来
自
N
(
μ
,
σ
2
)
的
样
本
,
x
是样本的平均值,则有
x
~
N
(
μ
,
σ
2
/
n
)
定理二
若
x
0
,
x
1
,
x
2
,
x
2
,
x
2
,
来
自
N
(
μ
,
σ
2
)
的
样
本
,
x
,
S
2
是样本的平均值和方差,则有
1.
(
n
−
1
)
S
2
σ
2
~
χ
(
n
−
1
)
2.
x
与
S
2
相互独立
定理三
x
−
μ
σ
/
n
√
N
(
0
,
1
)
对于两个正态总体的样本均值和样本方差有定理四
定理四
正态分布可加性:
若
x
1
~
N
(
μ
,
σ
2
i
)
,
i
=
1
,
2
,
3
,
4
,
5
,
⋯
,
n
且他们相互独立,则它们的线性组合:
C
1
X
1
+
C
2
X
2
+
C
3
X
3
+
⋯
+
C
n
X
n
~
N
(
∑
n
i
=
1
C
i
μ
i
,
∑
n
i
=
1
C
2
i
μ
2
i
)