星星_品职助教 · 2021年12月02日
同学你好,
这个地方不是很重要,考试不会考推导。
图的大意是实际的数据点 yi,和y的均值(用 y bar来表示),存在差异。这个差异分成两部分。
第一部分可以用回归方程来解释。因为回归方程估计出来的值(用y hat来表示)本来就与y bar不同。所以 y hat - y bar 就认为是回归方程能解释的(和y bar有差距的)部分。这部分平方求和后就是SSR。
第二部分是回归方程以上的部分,这部分回归方程也解释不了(残差),就是 yi - y hat。这部分平方求和后就是SSE。
-------
以上大意简单了解即可。
这个图的目的是得到后面的ANOVA table。经过数学推导和转换后(推导过程没讲,不用管)可以得到SSR+SSE=SST。
进一步得到SSR/SST=R-squared,F statistics=MSR/MSE等指标。