星星_品职助教 · 2021年04月23日
同学你好,
①learning curve里面的准确率指得是模型预测的准确率
②validation sample用于验证和调试从training set中得到的模型。test sample用于测试得到的模型预测新数据的能力
③
1)这幅图的横轴是training samples的数量,和validation sampls的数量无关,可以认为validation samples的数量不变
2)图像形状可以从极端情况开始考虑,如果只有1个training sample,那么模型肯定无论怎样都会包括这个点,也就是预测的非常准,所以此时的training accuracy rate会很高。但这个模型拿到validation samples里去验证可想而知,肯定是不好的。所以validation accuracy rateI一开始就很低。
3)随着training samples数量的增加,training set里的模型预测能力反而不如只有几个samples时模型预测的那么准。但这个时候模型从预测角度实际是变得更好的,所以validation accuracy rate反而是增加的。