
在生物医药统计分析研究中,最常见的就是对某一种二分类的因变量进行影响因素分析。比如某个疾病是否患病,有或无,出现或没出现,复发或没复发等等这种对立的二分类变量,要研究他的可能影响因素有哪些,这时候二元Logistic回归就是最常用的,也是最有效的。
今天我们通过下面实例来介绍SPSS二元Logistic回归的操作与结果的分析。
先来看本次的实例,下面是136位患者的合并症的相关数据,分为是合并症和非合并症两类,而我们需要研究年龄、孕期体重增加、孕34周FPG、早孕血糖这几个因素是否会影响合并症。数据如下图1:

(图1)
SPSS中的操作步骤:
①点击“分析”–“回归”–“二元Logistic”,在弹出的回归对话框中分别将合并症和其他变量选入因变量和协变量框中。

(图2)

(图3)
②然后进行相关的参数设置。这里的年龄、孕期体重增加、孕34周FPG都属于连续数值型变量,可以直接作为协变量,而早孕血糖属于分类变量,这里就需要进行相关的设置了。点击右上的“分类”按钮,在弹出的对话框中,将早孕血糖分组选入右侧的分类框中。

(图4)

(图5)
③然后点击右侧“保存”按钮,勾选“预测值”下的“概率”和“成员组”两个标签。再点击右侧“选项”按钮,在弹出的对话框中勾选“霍斯默拟合优度”和“EXP(B)95%置信区间”。

(图6)

(图7)
④在设置完以上所有参数后,就可以点击下方确定按钮,运算并输出结果了。在这里我们最主要看的是以下几张结果表格。我们这里将对应下方主要结果表格进行一一分析。

(图8)
首先是霍斯默拟合度检验,P>0.05,接受H0假设,数据与回归模型拟合较好。

(图9)
然后是模型预测准确率达到66.4%大于60%进一步说明数据拟合较好,能够较准确的反应自变量对因变量的影响情况。

(图10)

(图11)
这里图10就是我们最重要的结果了,反应了自变量和因变量的影响关系的定性和定量关系。
由表中可以看出:在0.05的显著性水平下,早孕期血糖能显著影响合并症,P=0.041<0.05。回归系数B=-0.982<0,说明类别1,结合图11 也就是早孕期血糖≤5.61的患者比参考类别0,也就是早孕期血糖>5.61的患者患合并症的概率要低。最后看Exp(B)也就是OR值,风险比例值=0.375,定量的说明早孕期血糖≤5.61患合并症的概率是早孕期血糖>5.61的患者的0.375倍。而其他3个自变量年龄、孕期体重增加、孕34周FPG则不能显著影响合并症。他们的P均大于0.05。
以上就是今天我们讲解的SPSS二元Logistic回归在医学统计分析中的应用操作及分析,由于医学中的二分类病理研究十分多,因此掌握此方法对医学统计分析十分有用。当然除了二元Logistic回归外,还有当因变量为多分类比如某疾病的多个阶段等等,当因变量分类大于两类时候,就需要用到多分类的logistics回归了,这里又分为无序和有序多分类。我们将在今后的文章中给大家着重讲解。敬请大家关注!

●
AMOS结构方程进行医学问卷量表分析教程
●
SPSS生存分析在生物医药统计中的应用
●
GraphPad Prism绘制柱状图
●
SPSS中对问卷数据进行探索因子分析
●
SPSS问卷数据统计分析之项目分析
●
Excel进行线性回归模型分析的操作与结果解读
●
Excel在统计分析中的应用之单因素方差分析
●
Excel进行基础数据分析之VLOOKUP函数及透视表的应用
●
Excel进行数据分析常用方法及函数汇总
●
SPSS中常用的参数和非参数检验方法、基本原理和操作步骤
●
ROC曲线在SPSS中的具体操作及医学和生物统计中的应用
●
一文读懂R语言如何实现逐步回归分析
●
R语言中如何绘制散点图和箱线图?看完即会
●
SPSS中的Variable数据变量类型介绍