06:37 (2X)
这里我没太听懂 为什么n种类型要设置n-1个dummy variable 如果设置n个就违反了多重共线性?
品职助教_七七 · 2024年06月21日
嗨,努力学习的PZer你好:
以板书的例子出发
可以看出X5就是1-(X1+X2+X3+X4),也就是X5里的内容完全都是前面四个变量里的内容,没有新的东西。所以,设置X5毫无意义,因为内容都可以用前面四个变量来表示;另一方面,在四个变量的基础上再多设个X5,相当于把前面四个变量已经体现了的内容再说一遍,就重复了。
上述内容从数学角度出发,就是X1+X2+X3+X4+X5=1这个式子是一个线性关系。X5可以写成前四个变量的线性组合。这种情况就产生了多重共线性这种错误,会引起自变量的冗余。冗余会引发系数不准确等一系列的问题。
----------------------------------------------努力的时光都是限量版,加油!