用SPSS作Logistic回归分析,自变量较多,先用单因素分析对自变量进行筛选,得出影响因变量的自变量有2个,对这2个自变量作Logistic回归,最后的结果是:
自变量一的系数b=-5.423,Wald值=4.800,P=0.028
自变量二的系数b=0.001,Wald值=3.999,P=0.046
常数为0.847
这个结果怎么判读?
补充说明:
1、Hosmer and lemeshow test for goodness of fit里P=0.414
2、在SPSS弹出的“Logistic Regression”对话框里的“Method”我选Forward Stepwise (Conditional)
主要是看各个自变量的假设检验结果,和系数。两个自变量都有统计学意义,系数分别为-5.423和0.001,也就是说,随着自变量一增加一个单位,因变量要降低5.423三个单位。自变量二同理。比如因变量是高血压患病与否,随着自变量一得增加,患病危险降低。说明自变量一为保护因素。
Logistic回归模型的适用条件:
1 、因变量为二分类的分类变量或某事件的发生率,并且是数值型变量。但是需要注意,重复计数现象指标不适用于Logistic回归。
2 、残差和因变量都要服从二项分布。二项分布对应的是分类变量,所以不是正态分布,进而不是用最小二乘法,而是最大似然法来解决方程估计和检验问题。
3 、自变量和Logistic概率是线性关系
4 、各观测对象间相互独立。
扩展资料
1、软件功能
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。
用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。
其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。
对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。
2、Logistic回归实质
发生概率除以没有发生概率再取对数。就是这个不太繁琐的变换改变了取值区间的矛盾和因变量自变量间的曲线关系。究其原因,是发生和未发生的概率成为了比值 ,这个比值就是一个缓冲,将取值范围扩大,再进行对数变换,整个因变量改变。
不仅如此,这种变换往往使得因变量和自变量之间呈线性关系,这是根据大量实践而总结。所以,Logistic回归从根本上解决因变量要不是连续变量怎么办的问题。还有,Logistic应用广泛的原因是许多现实问题跟它的模型吻合。例如一件事情是否发生跟其他数值型自变量的关系。
参考资料来源:百度百科-logistic回归