1、老师好,蓝色线部分,如果设置small firms的虚拟变量是0,m是1,l是2,具体怎么表现?为什么季节不能设置第一个季节是1,第二个季节是2,第三个季节是3,第四个季节是4呢?
2、红色方框应该是真是的Y吧?不应该有一个cap符号
pzqa39 · 2024年08月17日
嗨,爱思考的PZer你好:
1、这些编码值可以直接作为模型的输入,其中数值0、1、2体现了公司规模的顺序关系。模型会基于这些编码值理解并分析公司规模对目标变量的影响。这种编码方式的优点是,它保留了类别之间的顺序信息,比如,大型公司可能对目标变量的影响大于中型公司,而中型公司又大于小型公司。但是这一部分内容属于超纲了,考试当中不太可能出现。
2、两个原因,如果我们用1、2、3、4来编码季节,模型可能会误解这些数值之间的关系,认为“夏天”(2)和“冬天”(4)之间的差异比“春天”(1)和“夏天”(2)之间的差异更大,但实际上季节之间的关系并不是线性可比较的。这意味着模型可能会推测出季节之间不存在的数值关系,从而导致错误的预测或分析结果。另外,季节具有循环性质(冬天之后是春天),简单的顺序编码(1, 2, 3, 4)无法表达这种循环。例如,冬天(4)和春天(1)之间的关系在数值上看起来差异最大,但实际上它们是紧密相连的。
3、红色的部分是估计值,原版书里是这样写的
----------------------------------------------加油吧,让我们一起遇见更好的自己!
梦梦 · 2024年08月19日
1和2都明白了,3的话Ycap后面的一长串本身不就是Ycap吗?那不就等于Ycap-Ycap就等于0了?