HUANGy · 2020年04月19日

原版书课后题reading 5 多元回归problem 8E

老师，关于这道题目问的是inconsistency,我的疑惑是这样的：

首先，我理解这道题问的是在多元回归模型中某一个coefficient estimate的变化是否对模型整体的解释力度（一致性）有影响？因为这道题对比problem 3的回归模型加入了sp500 index新的变量，而新的变量促使模型解释力度更强，必然会自然导致之前的某一个自变量力度变差，这其实也说明这个新增的自变量解释力度更好

我的疑惑其实是这样的：因为这个reading讲到的三种违反多元回归的假设中都提到序列相关、多重贡献、条件异方差都不会导致parameter estimates consistency的变化，也就是说随着自变量的增加，模型整体解释力度增强的持续性是不会改变的（F-TEST不影响），只有多重贡献会导致估计系数不准确（t统计量不准确）。

那么parameter estimates consistency和这道题目涉及到的consistency是否是一个范畴呢，还是包含关系？如果是包含关系，能不能这么理解：即使再加上更多的自变量，即使新的自变量加入会导致之前的某一个自变量上升或者下降，但是整体上都不影响模型本身的consistency?

添加评论

2 个答案

已采纳答案

星星_品职助教 · 2020年04月20日

同学你好，

这道题想复杂了，inconsistency的意思在这里面直译成不一致就可以，不需要考虑统计上的一致性。题干重新梳理一下，说的是一开始“size”这个自变量的系数是0.3199（第三题），但是在增加了一个自变量后，同样的“size”自变量的系数变成了0.2648（第八题），由于这两个数字相差较大，题目问这两个结果是否存在不一致，或者可以理解为这里面是不是出现了什么错误，否则怎么两次估计相差那么多。

虽然两次估计的系数相差较大，但是不存在错误，原因是第八题的模型了新增了一个可以解释Y的新自变量。这个自变量自然会分走一部分对Y的解释，所以原自变量的系数都会减小，这是正常现象。

总而言之就是这道题里的consistency和违背OLS假设的那种情况里的consistency并不是一个意思。后者指的是随着n增加，估计误差会减小。这道题目是增加了自变量，但是n还是500并没有改变。

添加评论

HUANGy · 2020年04月20日

这下通透了！这是两个维度的事情，一个是样本数量n是否增加从而提高R2，一个是在样本数量不变的情况下增加了自变量。老师，那我再补充一个问题，后者在样本数量不变情况下增加了自变量的R2其实不一定会增加模型的解释力度，对吧，所以才引发了adjusted R2, 也就是说adjusted R2是在样本数量不增加的前提下界定的？可以这么理解吗？

星星_品职助教 · 2020年04月22日

同学你好，

可以这么理解。自变量增加，只要这个自变量和Y有哪怕一丁点的联系，R2就一定会增加，哪怕是这个自变量对模型没有很大的贡献。所以这个时候用R2来衡量模型的拟合优度就会产生混淆。于是就引入了adjusted R2。

关于你提到的“样本数量不增加”补充一个结论，做题也会遇到。如果用adjusted R2去比较两个模型的拟合优度，需要有两个前提。第一，增加自变量的过程中Y的定义不能因自变量的增加而改变。即两个模型的Y定义相同；第二. sample size不能变。在满足这两条的前提下，可以说adjusted R2大的模型拟合的好。

添加评论

原版书课后题reading 5 多元回归problem 8E

2 个答案

2

0

350

相关问题