开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

HUANGy · 2020年04月19日

原版书课后题reading 5 多元回归problem 8E

老师,关于这道题目问的是inconsistency,我的疑惑是这样的:

首先,我理解这道题问的是在多元回归模型中某一个coefficient estimate的变化是否对模型整体的解释力度(一致性)有影响?因为这道题对比problem 3的回归模型加入了sp500 index新的变量,而新的变量促使模型解释力度更强,必然会自然导致之前的某一个自变量力度变差,这其实也说明这个新增的自变量解释力度更好


我的疑惑其实是这样的:因为这个reading讲到的三种违反多元回归的假设中都提到序列相关、多重贡献、条件异方差都不会导致parameter estimates consistency的变化,也就是说随着自变量的增加,模型整体解释力度增强的持续性是不会改变的(F-TEST不影响),只有多重贡献会导致估计系数不准确(t统计量不准确)。


那么parameter estimates consistency和这道题目涉及到的consistency是否是一个范畴呢,还是包含关系?如果是包含关系,能不能这么理解:即使再加上更多的自变量,即使新的自变量加入会导致之前的某一个自变量上升或者下降,但是整体上都不影响模型本身的consistency?

2 个答案
已采纳答案

星星_品职助教 · 2020年04月20日

同学你好,

这道题想复杂了,inconsistency的意思在这里面直译成不一致就可以,不需要考虑统计上的一致性。题干重新梳理一下,说的是一开始“size”这个自变量的系数是0.3199(第三题),但是在增加了一个自变量后,同样的“size”自变量的系数变成了0.2648(第八题),由于这两个数字相差较大,题目问这两个结果是否存在不一致,或者可以理解为这里面是不是出现了什么错误,否则怎么两次估计相差那么多。

虽然两次估计的系数相差较大,但是不存在错误,原因是第八题的模型了新增了一个可以解释Y的新自变量。这个自变量自然会分走一部分对Y的解释,所以原自变量的系数都会减小,这是正常现象。

总而言之就是这道题里的consistency和违背OLS假设的那种情况里的consistency并不是一个意思。后者指的是随着n增加,估计误差会减小。这道题目是增加了自变量,但是n还是500并没有改变。

HUANGy · 2020年04月20日

这下通透了!这是两个维度的事情,一个是样本数量n是否增加从而提高R2,一个是在样本数量不变的情况下增加了自变量。老师,那我再补充一个问题,后者在样本数量不变情况下增加了自变量的R2其实不一定会增加模型的解释力度,对吧,所以才引发了adjusted R2, 也就是说adjusted R2是在样本数量不增加的前提下界定的?可以这么理解吗?

星星_品职助教 · 2020年04月22日

同学你好,

可以这么理解。自变量增加,只要这个自变量和Y有哪怕一丁点的联系,R2就一定会增加,哪怕是这个自变量对模型没有很大的贡献。所以这个时候用R2来衡量模型的拟合优度就会产生混淆。于是就引入了adjusted R2。

关于你提到的“样本数量不增加”补充一个结论,做题也会遇到。如果用adjusted R2去比较两个模型的拟合优度,需要有两个前提。第一,增加自变量的过程中Y的定义不能因自变量的增加而改变。即两个模型的Y定义相同;第二. sample size不能变。在满足这两条的前提下,可以说adjusted R2大的模型拟合的好。

  • 2

    回答
  • 0

    关注
  • 350

    浏览
相关问题