从总体中随机抽取样本的目的_【知识】单个总体均值的估计

  • Post author:
  • Post category:其他





单个总体均值的区间估计和相应的蒙特卡罗模拟


设想一下这样的场景:现有一大批零件,我们想了解这批零件的某个特性(比如长度)的平均值,该用什么办法呢?如果全部测量将会耗费大量人力物力,现实的做法往往是从中随机抽取少量的零件进行测量,根据获得的样本数据估计总体均值。本文讨论具有类似性质的问题,即如何根据样本观测值估计总体均值。

ae1b11025c69832b17bae0cef568bbc6.png

01

总体均值的置信区间


大样本

当样本数量n≥30时,该样本可视为大样本。根据中心极限定理,选择标准正态随机变量Z作为枢轴统计量,则总体均值的区间估计方法如下:

822c9ff947ed637aa4fd35d019ecdd8d.png

在大多数情况下,总体标准差σ是未知的,因此通常使用样本标准差s作为总体标准差的估计量,下同。


小样本

如果样本属于小样本,并且总体近似正态分布,可以使用T统计量做为枢轴统计量,此时总体均值的区间估计方法如下:

fc6fccef70b53bb0682bf8dc608a4030.png

注意:对于小样本,当总体严重偏离正态分布时,这种估计方法可能存在偏差,推荐使用其他的估计方法。

02

蒙特卡罗模拟


小样本估计总体均值


1)总体为正态分布

假设总体是均值为5,方差为1的正态分布,从中随机抽取10个样本,试根据样本观测值求总体均值的95%的置信区间。

①生成随机数(每次试验生成10个观测值,进行100个重复试验)

eb2033709653db7120af41340e35b358.png

②根据规则构造总体均值的置信区间,检查成功捕获的区间比例


可以发现,成功捕获总体的区间在95%左右



2171538e77a9b7f8c70ceaf08c880370.gif


2)总体为指数分布(严重偏离正态性)

假设总体是均值为5的指数分布,从中随机抽取10个样本,试根据样本观测值求总体均值的95%的置信区间。

①生成随机数

1c8bbb2aef548b66048b13ef91a2083f.png

②根据规则构造置信区间,检查成功捕获总体均值的区间比例


从结果来看,成功捕获总体均值的区间比例很可能小于95%


0d0e5ddbcbba79d407783911de15af0b.gif



版权声明:本文为weixin_39926016原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。