星星_品职助教 · 2021年08月07日
同学你好,
一般的说法是F检验显著,R-squared很大。这个是基础,先解释这一层。
-------
以Y=b0+b1X1+b2X2+ε为例,多重共线性指的是X1和X2之间存在强相关关系(所以应该去掉其中的一个)。
①F检验
F test检验的是方程“整体”是否成立,虽然在多重共线性的背景下,X1和X2可以认为是同一个东西,但X1(或X2)还是可以解释Y的。所以方程作为整体是成立的,F检验显著。
②R-squared
R-squared表示方程对Y的解释力度,和第①点类似,由于Y还是可以被X1(或X2)解释的,所以R-squared也很高。
--------
但因为方程此时实际上是有问题的,所以F检验其实不该这么显著(等价于F-statistics不应该像计算出来的这么大),R-squared也不应该这么大。
所以做F-statistics和R-squared都是被高估了的。
(高估其实是一个数学问题,涉及到复杂的证明,原版书上是不讲的。所以按照以上逻辑去理解和记忆就可以了)