logistic回归分析,各变量之间存在相关性,彼此相互影响,可以做logistic吗
发布网友
发布时间:2022-04-30 18:03
我来回答
共1个回答
热心网友
时间:2023-10-09 09:23
你可以先检查一下 VIF 。
以下来自于百度百科:
方差膨胀因子(Variance Inflation Factor,VIF):是指解释变量之间存在多重共线性(Multi-collinearity)时的方差与不存在多重共线性时的方差之比。容忍度的倒数(成反比),VIF越大,显示共线性越严重。经验判断方法表明:当0<VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;
一般的统计软件都可以查这个值,每一个变量后面都会显示一个VIF的值,然后你逐个踢掉,从最大的那个VIF开始,一个一个踢,直到所有的变量的VIF全部小于10,你就可以继续做regression了。
注意,这里的相关性指的是线性相关性,与单纯的correlation coefficient(相关因子)并不一样。但有一定的联系。有线性相关的变量之间correlation coefficient肯定大,但是反之correlation coefficient并不能百分之百的说明线性相关。以上的方法是处理(多重)线性相关的情况,这个会影响回归分析(regression)比较严重。