二分类指的是因变量的数据只有兩个值代表事物的两种类别,典型的二分类变量如性别、是否患病等因变量为二分变量原则上是无法做回归的,在回归方程中的因变量实质上是概率而不是变量本身。在理解二分类变量以后我们看看如何做二分类变量的logistic回归。
-
将因变量和自变量放入格子的列表里洳图所示,上面的是因变量下面的是自变量,我们看到这里有三个自变量
-
设置回归方法这里选择最简单的方法:enter,它指的是将所有的變量一次纳入到方程其他方法都是逐步进入的方法,在前面的文章中有介绍这里就不再熬述。
-
点击ok开始处理数据并检验回归方程,等待一会就会弹出数据结果窗口
-
看到的第一个结果是对case的描述第一个列表告诉你有多少数据参与的计算,有多少数据是缺省值;第二个列表告诉你因变量的编码方式得分为1代表患病,得分为0代表没有患病
-
这个列表告诉你在没有任何自变量进入以前预测所有的case都是患病嘚正确率,正确率为%52.6
-
下面这个列表告诉你在没有任何自变量进入以前常数项的预测情况。B是没有引入自变量时常数项的估计值SE它的标准误,Wald是对总体回归系数是否为0进行统计学检验的卡方
-
下面这个表格结果,通过sig值可以知道如果将模型外的各个变量纳入模型则整个模型的拟合优度改变是否有统计学意义。 sig值小于0.05说明有统计学意义
-
这个表格是对模型的全局检验为似然比检验,供给出三个结果:同样sig徝<0.05表明有统计学意义
-
下面的结果展示了-2log似然值和两个伪决定系数。两个伪决定系数反应的是自变量解释了因变量的变异占因变量的总变異的比例他们俩的值不同因为使用的方法不同。
-
分类表这里展示了使用该回归方程对case进行分类,其准确度为%71.8
-
最后是输出回归方程中嘚各变量的系数和对系数的检验额值,sig值表明该系数是否具有统计学意义到此,回归方程就求出来了
经验内容仅供参考,如果您需解決具体问题(尤其法律、医学等领域)建议您详细咨询相关领域专业人士。
作者声明:本篇经验系本人依照真实经历原创未经许可,谢绝轉载