箱线图应该怎么用?

  • Post author:
  • Post category:其他


一、箱线图例说明:

箱子的中间一条线,是数据的中位数,代表了样本数据的

平均水平

。箱子的上下限,分别是数据的上四分位数和下四分位数。这意味着箱子包含了50%的数据。因此,箱子的宽度在一定程度上反映了数据的

波动程度

。在箱子的上方和下方,又各有一条线。有时候代表着最大最小值,有时候会有一些点“冒出去”。如果有点冒出去,理解成

“异常值”

就好。


二、R语言里面的boxplot的example,拿来跟大家分享。这个箱线图略复杂,共涉及3个变量。定量变量是牙齿生长长度,体现在图形的纵坐标,也就是箱子展示的内容。第一个定性变量是维他命C的剂量,三个水平(0.5mg,1mg和2mg),体现在横坐标,所以一共有3组箱线图;第二个定性变量是食用的食物,是维C还是橙汁,分别用黄色和橙色展现,所以每组箱线图里又包含两个箱子。

从上图可以得到这些结论:

随着使用剂量的增加,不管食用的是哪种食物,牙齿生长长度的平均水平(中位数)都在增加。当使用剂量为0.5mg和1mg时,食用橙汁带来的牙齿生长的平均长度(中位数)要比食用维C高,波动程度也相应更大。当使用剂量为2mg时,食用两种食物带来的牙齿生长平均水平(中位数)相当,食用维C的牙齿生长长度波动相对更大。



版权声明:本文为qq_27796453原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。