老师好, 这题是QBANK 里的, 知道ERROR 的三大来源是bias error, variance error and base error. 想问一下的是这里问的是out of sample error , bias error 不是in sample error (因为测试的是模型对training data set 的拟合程度)吗? 谢谢。
星星_品职助教 · 2019年12月03日
同学你好,
这里面的概念挺绕的。可以理解为out-of-sample error是在验证集(validation)和测试集(test)里的模型预测的Y和真实的Y之间的差异。这部分差异可以分解为这三部分。如果其中的Biased error很高,就可以推断这个模型的in-sample error也很高。
换而言之,如果in-sample error本身就很高,那么也会导致验证集和测试集里测试的时候,out-of-sample error高,这部分由于训练集导致的误差在out-of-sample error里就体现为bias error。原版书相应部分摘录如下作为参考,加油~