开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

薛定谔的蝎子 · 2023年05月29日

这题不是根据financial and non-financial characteristics进行分类了么,这种应该是监督式学习啊,为什么是k-mean啊,不是很明白。非监督式不是不应该设定参数的特点么,让他自己归类?

* 问题详情,请 查看题干

NO.PZ201512020300000503

问题如下:

Which of the following machine learning techniques is most appropriate for executing Step 2:

选项:

A.

K-Means Clustering

B.

Principal Components Analysis (PCA)

C.

Classification and Regression Trees (CART)

解释:

A is correct. K-Means clustering is an unsupervised machine learning algorithm which repeatedly partitions observations into a fixed number, k, of nonoverlapping clusters (i.e., groups).
B is incorrect. Principal Components Analysis is a long-established statistical method for dimension reduction, not clustering. PCA aims to summarize or reduce highly correlated features of data into a few main, uncorrelated composite variables.
C is incorrect. CART is a supervised machine learning technique that is most commonly applied to binary cla
ssification or regression.

这题不是根据financial and non-financial characteristics进行分类了么,这种应该是监督式学习啊,为什么是k-mean啊,不是很明白。非监督式不是不应该设定参数的特点么,

1 个答案

星星_品职助教 · 2023年05月29日

同学你好,

判断算法要看有没有target variable,也就是有没有指定的谁是X,谁是Y。非监督式学习不设定具体的Y变量。

本题是将1万只股票分成20个组,financial and non-financial characteristics只是分组的原则。这里面没有对哪个变量是自变量,哪个变量是因变量贴标签。每个数据具体会分到哪个组里是不知道的。

基于本题的描述,可以看出实质是根据相似点分组,符合k means clustering的定义。

  • 1

    回答
  • 0

    关注
  • 216

    浏览