开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

丁洁Amy · 2021年05月02日

关于讲义中关于聚类题的探讨

老师好,我刚刚看到讲义reading7中的K-means和hierarchical clustering这两个聚类方法。然后讲义第235-239页的题目中,我对238页的第二题不是很明白。 截图也会在下面放上来


首先,第二题正确答案是C,但是在看题干的时候,我觉得选项B是包含选项C的。既然按答案的思路说选项C中的feature set需要是因为不然不知道怎么算欧几里得距离,那这样看B也没错,只不过它没说的那么细。


其次,我当时选的是A,因为我记得老师上课讲过,只有K means需要定义K是多少这个超参数,也没提及说需要定义feature set.所以我当时一下子就选了A。


请老师帮忙分析下我哪里想的不对,谢谢!

2 个答案
已采纳答案

星星_品职助教 · 2021年05月04日

同学你好,

回复追问:

k-means需要距离的,算距离的方法要事先定下来,如采用欧式距离来计算。

features是人为事先指定好的。

但features和距离都不是超参数。超参数的问题不用想那么复杂,谁是超参数是纯人为定义的,k-means里只有k是超参数,别的都不是。记一下就可以了。

学习加油。

丁洁Amy · 2021年05月04日

收到,谢谢老师

星星_品职助教 · 2021年05月03日

同学你好,

k-means算法需要用到1)超参数k和2)距离,其中要计算距离,就需要3)特征集(feature set)

B选项错误的原因是只有k才是超参数,距离和feature set都不是超参数。所以C也就没有包含B。

C正确的原因是feature set虽然不是超参数,但也必须要定义,不然距离算不出来。


  • 2

    回答
  • 0

    关注
  • 322

    浏览
相关问题