标绿的地方,想不明白为什么残差项的标准差会影响b1的标准差
品职助教_七七 · 2024年01月28日
嗨,爱思考的PZer你好:
以老师课上画过的图为例。回归分析是通过从总体中抽取的样本来估计系数的。不同的样本会估计出不同的系数,对应不同的残差。
所以系数的参数估计量和残差都是随机变量。
下图的左图中,历次估计的直线都相差不大,所以斜率系数(b1)的估计量也相差不大。对应系数b1估计量的标准误也就比较小。同时,由于各条直线都差不多,所以和数据点之间的残差也差不多。残差估计量的波动也不大。对应残差估计量的标准误也就比较小。
下图的右图中,历次估计的直线相差较大。对应斜率系数(b1)的估计量波动的也就比较大,反应到系数b1估计量的标准误上就是标准误大。同时,由于各条直线和数据点的位置不一,残差估计量相差的也多,对应残差估计量的标准误也大。
由此可以看出,残差估计量的标准误 和 系数b1估计量的标准误 是有一定关系的。如果残差估计量的标准误很大,系数b1估计量的标准误就也会很大。反之也是一样。以上是图像角度的简单理解。
如果从数学角度出发,这个关系实则非常简单。系数b1估计量的标准误 和 残差估计量的标准误 两者之间有公式联系。这个公式比较复杂,教材并没有给出。但可简单理解为系数b1估计量的标准误 =A × 残差估计量的标准误 (其中A是一系列其他式子的组合)。所以如果后者变化,前者必然随着变化。
以上从图像到公式都不是教材内容。只掌握最终的结论:系数b1估计量的标准误 会受到 残差估计量的标准误 的影响 即可。
----------------------------------------------加油吧,让我们一起遇见更好的自己!