相关系数及相关性分析（数学建模）

一，皮尔逊pearson相关系数

1 pearson相关系数使用条件和检验条件

1) 使用和检验条件

我们常说的相关系数指得就是皮尔逊（pearson）相关系数。

条件一：我们的样本数据必须满足

正态分布

。

条件二：样本数据是

连续

的且数据之间的差异不能太大（不能包含

离群点

或异常值）。

条件三：每组样本之间

相互独立

。

条件四：皮尔逊相关系数有效的前提是两组数据（两个对象）之间呈

线性关系

。

2) 散点图检验

使用EXCEL或者SPSS（对象很多）或者matlab

绘制散点图

来看是否存在线性关系，并看数据是否连续，有无离群点。

3) 正态分布检验

正态分布检验：

雅克‐贝拉检验

(Jarque‐Bera test) 和Shapiro‐wilk

夏皮洛‐威尔克检验

以及

Q-Q图

1）

JB检验

：MATLAB中进行JB检验的语法：[h,p] = jbtest(x,alpha)。

JB检验是大样本检验（

n>30

）

注解：
h返回0或1，1表示拒绝原假设，0表示接受原假设，且H0：该随机变量服从正态分布，H1：该随机变量不服从正态分布。
p返回P值。
x是数据向量。
alpha是显著性水平，一般0.05。

2）

Shapiro‐wilk检验

：Shapiro‐wilk检验是小样本检验（

3≤n≤50

）

SPSS

操作。分析->描述统计->探索->图->含检验的正态图。得到P值，P值<0.05表示拒绝原假设即随机变量不服从正态分布。

3）

Q-Q图

：要利用Q‐Q图鉴别样本数据是否近似于正态分布,只需看Q‐Q图上的点是否近似地在

一条直线

附近。（要求

数据量非常大

）

MATLAB函数

qqplot（x）

：x是数据向量。

2 pearson相关系数如何求？

MATLAB的

corrcoef

函数。

R = corrcoef(A)

返回 A 的相关系数的矩阵，其中 A 的列表示随机变量（指标），行表示观测值（样本）。

R = corrcoef(A,B)

返回两个随机变量 A 和 B （两个向量）之间的相关系数。

3 pearson相关系数假设性检验（显著性检验）

1）

MATLAB

一行代码：[R,P] =

corrcoef

(Test)

R返回的是相关系数表，P返回的是对应于每个相关系数的p值

p值小于0.05说明在95%置信水平上拒绝原假设即相关系数显著异于0。

2）

SPSS

也可生成相关系数表，并且有

显著性标记

步骤：分析->相关->双变量->皮尔逊

二，斯皮尔曼spearman等级相关系数

spearman等级相关系数的定义有两种，MATLAB使用的定义是：斯皮尔曼相关系数被定义成等级之间的皮尔逊相关系数。等级按照从小到大排序。

在这里插入图片描述

MATLAB使用函数：corr(X , Y , ‘type’ , ‘Spearman’)或corr(X , ‘type’ , ‘Spearman’)分别表示两个

列向量

的spearman等级相关系数和

X矩阵各列之间

的spearman等级相关系数。

1 spearman等级相关系数假设性检验（显著性检验）

分为

小样本

和

大样本

两种情况:

1）小样本

小样本情况，即? <=??时，直接查临界值表即可。

在这里插入图片描述

当相关系数

大于

临界值说明相关系数显著异于0即

显著相关

2）大样本

MATLAB函数[R,P]=corr(X, ‘type’ , ‘Spearman’) //直接给出P值

P值

小于

0.05则

拒绝原假设

即相关系数和 0 有显著性差异。

三，两种相关系数的选择

满足皮尔逊相关系数的

使用条件

和

检验条件

则使用皮尔逊相关系数。

只要其中一个条件不满足则使用斯皮尔曼等级相关系数。另外两个

定序数据

之间的相关系数求解也用斯皮尔曼。斯皮尔曼相关系数的适用条件比皮尔逊相关系数要广。

//定序数据：其反映在某一指标下观测对象的等级，排名，优劣等，可用数字和文字表示，但不能参与运算，所以只能用斯皮尔曼等级相关系数。

学数学建模可关注B站的清风数学建模，是个较好的途经去了解学习数学建模（亲测）。

原文链接：https://blog.csdn.net/SHRtuji/article/details/114107221

相关系数