星星_品职助教 · 2021年03月14日
同学你好,
这里的关键是:margin的变宽不是两侧同时平行向外移动的。
boundary是margin的中线,中线是随着margin同步变化的。如果margin是向两侧同步,均匀的变宽,那么中线不会变,分类也不会有改变。但margin变宽的方式可能是两侧向外移动的幅度不同,也可能移动后会改变斜率。以上都会显著改变中线的位置/斜率,造成分类改变。
如果margin特别窄,会使得中线仅仅适合training set的分类,对于新数据的分类可能不准确。如果margin变宽,就会出现误分类的情况。所以wider margin和error是trade-off的关系,最终要找到一个最优的权衡。
----------------------
以上的问题其实都不会考察,这种具体的解释原版书上也没有。原版书上只给了一些结论和主要逻辑。
机器学习的算法实际是无数的数学和编程语言结合在一起的,但CFA不要求掌握会建立算法,只要求知道算法是干什么的就可以。
所以这一章和下一章大数据的要求都是掌握结论为主,学习方法都是建议通过题目来学习。题目往往都比较简单。