问题如下:
- 关于statement 1,CART 中single feature, cutoff value这些不是需要认为决定的吗?这些不属于hyperparameter?
- 关于statement 2,cutoff value不是需要最大程度上把类别划分出来吗?这个不属于similarity(distance) measure?
- 关于statement 3, 讲义中KNN是有图可以表示的,这里不是说明KNN也可以vidual explanation?
星星_品职助教 · 2022年10月19日
同学你好,
回复问题1:
initial hyperparameter在CART算法中指的是设置“tree”的最大高度,节点的最多数量,每个节点最少包含的数据量这些,这当中并不包括cutoff value,后者是跟着feature(用来分类的特征值)走的。即有多少个features,就要有多少个cutoff value。
而不是简单粗暴就设定一个,然后整个模型都遵循这个参数的法则来运算。
对于A选项而言,CART是可以设置超参数的(例如以上那些),但是这不是CART算法可以使用的必须前提条件(requirement)。只有在当建模者认为CART有可能产生过度拟合问题时,才可能选择用加入这些超参数的方式来降低overfitting。