R计算两列数据的相关系数_R语言入门之相关性

  • Post author:
  • Post category:其他


今天这一期的内容主要是如何在R中进行数据之间的相关性分析,其实这一部分的内容和独立性检验的有点类似,大家可以对比着学习!

1. 相关性度量的assocstats()函数

在这里,我想和大家简单介绍一下如何度量列联表里分类变量之间的相关性。我们可以使用“vcd”包里的

assocstats(


x


)

函数,这里x是一个列联表,示例如下:

A <- c(rep("male",15),rep("female",20),rep("male",15))# 创建变量A
B <- c(rep("healthy",4),rep("sick",35),rep("healthy",11)) # 创建变量B
C <- c(rep("smoker",26), rep("nonsmoker",24)) # 创建变量C
mydata <- data.frame(A,B,C) # 利用以创建的变量构建数据框
library(vcd) #加载R包
mytable <- xtabs(~C+B+A, data=mydata) #生成列联表
assocstats(mytable) #计算关联度

d4e2e4c73b5641bba07a8acc4cf09f47.png

从结果中可以看到,男性中的吸烟和患病有一定相关性(Phi-Coefficient=0.467 >