09 numpy 聚合函数 – 极值,方差,标准差

  • Post author:
  • Post category:其他


=== 聚合函数定义 ===

对一组数据进行操作,如取均值、最大值等

scores = np.random.randint(1,9,[2,3])
scores


array([[3, 2, 8],



[4, 3, 3]])

== 最大值 max ==

axis 指定轴:0竖着的计算,1横着的计算

print(scores.max())
print(np.amax(scores,axis=0))
print(np.amax(scores,axis=1))


8



[4 3 8]



[8 4]

== 最小值 min ==

print(scores.min())
print(np.amin(scores,axis=0))
print(np.amin(scores,axis=1))


2



[3 2 3]



[2 3]

== 平均值 mean ==

print(scores.mean())
print(np.mean(scores,axis=0))
print(np.mean(scores,axis=1))


3.83333333333



[ 3.5 2.5 5.5]



[ 4.33333333 3.33333333]

=== 方差 Variance ===

方差是在概率论和统计方差衡量

随机变量

或一组数据时离散程度的度量。概率论中方差用来度量

随机变量

和其

数学期望

(即

均值

)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的

平均数

。在许多实际问题中,研究方差即偏离程度有着重要意义。

img_152de31bb057b2af58a251eec6cf2df9.png

总体方差计算公式

方差:

np.mean((a-a.mean()**2)

variance = np.mean((scores-scores.mean())**2)
variance


3.8055555555555549

=标准差 StandardDeviation=

用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

标准差: np.sqrt(方差)

np.sqrt(variance)


1.9507833184532706